漢字かな変換のテスト中

2009/09/10 | めも

といっても自分で実装するわけがなく先人の成果物を弄り回してるだけだけど.

http://dvorak.jp/lab/hconv/

Namazu つながりで知ってた KAKASI と,調べたら出てきた ChaSen と MeCab*1を叩いてみる.

coreserver に自分で入れるかーと思ったら全部デフォで入っていた.妙なところでさすが.

試しもせずに大した精度ないだろうと思っていたんだけど,一番新しくて賢げな MeCab はもちろん,古き良き KAKASI もさすがにこういうことに目的を絞ったソフトウェアなだけはあって頑張ってくれる.綺麗な日本語を突っ込む分には良い精度で機械的に変換できるもんなんだね.

ということがわかった.

もちろんというかあろうことかというか,応用先はタイピングゲームで. 漢字かな交じりの普通の文章突っ込むだけで打鍵対象に出来たら色々面白いかもねという. ブログのエントリがそのまま打鍵対象になるスクリプトだとか,RSS を取りこんでワードセットにするゲームだとか,ニコニコの歌動画のコメントから歌詞っぽい投稿してる人指定するとタイピングゲームになる TypingTube 改とか.

そんなもん書いてる場合じゃないですけどね常識的に考えて.

  1. これらは漢字かな変換っていうかガチに日本語形態素解析する用途で書かれた学術的なもの.言語情報科学に行ってたらお友達になっていたであろう子達である. []

Trackback URL

この記事にはまだコメントがついていません。

コメントをどうぞ