mecabのユーザ辞書を作る

mecabに登録されている辞書は基本的なものなので
自分で単語を入れたい時はユーザ辞書を作る必要があります。


ユーザ辞書に登録したい文言一覧をテキストにまとめる (例:ゲームタイトル)
gametitle.csv (UTF-8)

ファイアーエムブレム覚醒
コード・オブ・プリンセス
エルクローネのアトリエ


これを辞書に登録できるCSV形式に変更する
gametitle.csv (UTF-8)

ファイアーエムブレム覚醒,-1,-1,10,名詞,一般,*,*,*,*,ファイアーエムブレム覚醒,*,*,game_title,
コード・オブ・プリンセス,-1,-1,10,名詞,一般,*,*,*,*,コード・オブ・プリンセス,*,*,game_title,
エルクローネのアトリエ,-1,-1,10,名詞,一般,*,*,*,*,エルクローネのアトリエ,*,*,game_title,


CSVデータを辞書ファイルに変換する

$ /usr/local/libexec/mecab/mecab-dict-index -d /usr/local/lib/mecab/dic/ipadic -u gametitle.dic -f utf-8 -t utf-8 gametitle.csv


辞書ファイルを辞書ディレクトリに移動

mv gametitle.dic /usr/local/lib/mecab/dic/ipadic/gametitle.dic


辞書ファイルをユーザ辞書として設定

vi /usr/local/etc/mecabrc
; Configuration file of MeCab
;
; $Id: mecabrc.in,v 1.3 2006/05/29 15:36:08 taku-ku Exp $;
dicdir =  /usr/local/lib/mecab/dic/ipadic
userdic = /usr/local/lib/mecab/dic/ipadic/gametitle.dic


実行

mecab

辞書無

ファイアーエムブレム覚醒
ファイアーエムブレム	名詞,一般,*,*,*,*,*
覚醒	名詞,サ変接続,*,*,*,*,覚醒,カクセイ,カクセイ
EOS

辞書有

ファイアーエムブレム覚醒
ファイアーエムブレム覚醒	名詞,一般,*,*,*,*,ファイアーエムブレム覚醒,*,*,game_title
EOS

できた。