mecabのユーザ辞書を作る
mecabに登録されている辞書は基本的なものなので
自分で単語を入れたい時はユーザ辞書を作る必要があります。
ユーザ辞書に登録したい文言一覧をテキストにまとめる (例:ゲームタイトル)
gametitle.csv (UTF-8)
ファイアーエムブレム覚醒 コード・オブ・プリンセス エルクローネのアトリエ
これを辞書に登録できるCSV形式に変更する
gametitle.csv (UTF-8)
ファイアーエムブレム覚醒,-1,-1,10,名詞,一般,*,*,*,*,ファイアーエムブレム覚醒,*,*,game_title, コード・オブ・プリンセス,-1,-1,10,名詞,一般,*,*,*,*,コード・オブ・プリンセス,*,*,game_title, エルクローネのアトリエ,-1,-1,10,名詞,一般,*,*,*,*,エルクローネのアトリエ,*,*,game_title,
CSVデータを辞書ファイルに変換する
$ /usr/local/libexec/mecab/mecab-dict-index -d /usr/local/lib/mecab/dic/ipadic -u gametitle.dic -f utf-8 -t utf-8 gametitle.csv
辞書ファイルを辞書ディレクトリに移動
mv gametitle.dic /usr/local/lib/mecab/dic/ipadic/gametitle.dic
辞書ファイルをユーザ辞書として設定
vi /usr/local/etc/mecabrc
; Configuration file of MeCab ; ; $Id: mecabrc.in,v 1.3 2006/05/29 15:36:08 taku-ku Exp $; dicdir = /usr/local/lib/mecab/dic/ipadic userdic = /usr/local/lib/mecab/dic/ipadic/gametitle.dic
実行
mecab
辞書無
ファイアーエムブレム覚醒 ファイアーエムブレム 名詞,一般,*,*,*,*,* 覚醒 名詞,サ変接続,*,*,*,*,覚醒,カクセイ,カクセイ EOS
辞書有
ファイアーエムブレム覚醒 ファイアーエムブレム覚醒 名詞,一般,*,*,*,*,ファイアーエムブレム覚醒,*,*,game_title EOS
できた。