マイペースなプログラミング日記

DTMやプログラミングにお熱なd-kamiがマイペースに書くブログ

Senを使う準備

Java形態素解析ライブラリであるSenを使う準備をした。まずはSenのダウンロードページに行き、最新版をダウンロード。そして、unzipしてできたディレクトリに入りantした。そしてsen.jarとcommons-logging.jarを取り出し(junitも入ってるけど使わないのか?)クラスパスを通す。そして、confディレクトリを作るプログラムのディレクトリに移動させる。試しに簡単なプログラム書いて実行したら


Exception in thread "main" java.lang.IllegalArgumentException: Tokenizer Class: net.java.sen.ja.JapaneseTokenizer is invalid.
とでてきた。Googleで検索してみると辞書のbuildを忘れていたらしい。なのでsenのディレクトリにあるdicに入りantした。で作るプログラムのディレクトリにdicディレクトリを作り、そこに拡張子senのファイルを全部コピー。そしたら例外がでなくなった。これで準備完了。さっそく解析しまくるぞ!