komeの備忘録

東大院卒外資ITエンジニアの技術ブログ

Arch LinuxにMeCab+Neologdを入れる

日本語をパースするために用いるMeCabとNeologdをArch Linuxで使えるようにしたときの環境構築メモ。

環境

Arch Linux(kernel version 4.14.13)

目次

インストールしたい

MeCabとNeologdはpacmanにはないので,以下の2つのリンクを参考に、AURからgit clone して自分でビルドする必要がある。

まずは、適当なインストールディレクトリに移動しておこう

Arch User Repository - ArchWiki github.com

$ git clone https://aur.archlinux.org/mecab.git
$ makepkg -sri
$ git clone https://github.com/neologd/mecab-ipadic-neologd.git
$ ./bin/install-mecab-ipadic-neologd

色々makeすると、/usr/lib/mecab/に,dicディレクトリとかができた。

インストールできない

多分,MeCabのdicディレクトリのパス違いで怒られる。 対策は、以下の2つを考えた。

  1. MeCabのconfigを変える。
  2. cloneしたneologdディレクトリ下のmakeする際に呼び出されるスクリプトの中で用いられるパスを適当なパスに書き換える。

対策1は、configファイルを見つけることができなかった。従って今回は、対策2を採用した。

対策2は具体的には、neologdディレクトリの下の libexec/make-mecab-ipadic-neologd.sh の,100行目あたりにある記述、 MECAB_LIBEXEC_DIR=`${MECAB_PATH}-config —libexecdir` を適当なパスに書き換える。これは適当な文字列でsearchしよう。

/usr/lib/mecab/dic/ のディレクトリの中にipa dicとneologdがいればインストール完了。

動作確認

$ mecab -d /usr/lib/mecab/dic/neologd
(C) komee.org