マルコフ連鎖

ストレスフル - 永字八法の続き。
http://www.eiji8pou.pics/perl/scripts/gene.cgititleについて。
これに使った「ある単語の次にどの単語が来るか、統計的に処理して決める」と言う技法は、実は「マルコフ連鎖」の名前で数学的に有名であったらしい。無学な男でごめんね。
マルコフ連鎖とは俺の理解する限りでは、未来予測の一手法で、未来の事象を予測するのに直前の一事象のみを参照する方法らしい。
また、http://shohoji.net/blog/archives/000273.htmlによると、三語による判定が一般的らしい。
ふむん?
一つネタを思いついたな。
茶筅と組み合わせて、過去の自分のログを形態素解析したテーブルを作って、俺クローン人工無能ってのも面白いな。多分絶対みんなやってるだろうけど。
これでもこのブログ、XMLにしてエクスポートすると3メガくらいのテキスト量はあるんだ。データ部分やタグを抜いたとしても、2メガにはなると思う。これくらいの元データがあるなら、自動生成のネタとしては充分じゃないかと勝手に思ってる。
朝日新聞とか毎日新聞とかのCDを買ってそれ全部を元データにするってのも面白そうだが、金がかかるのは嫌だしな。そしてそこまでかけてがんばっても、朝日新聞的社説(自動生成)にしかならないと言う。orz