アクセスラインキング?
2011/07/20からのアクセス回数 4606
集合知の3章をおさらいしたときには、Chasenを使ったのですが、MeCabの方がよいとの情報を得て、 Sageで「集合知の3章図3.3を再現する」記事のために、MeCabとmecab-python、おまけにfeedparser をSageにインストールしました。
忘備録として、MeCabのインストール手順を書き留めておきます。
以下の手順は、MacOSX(Linon)、CentOS 5.7(さくらVPS)で試しています。
MeCabのソースと展開ディレクトリは、~/localで実行しました。
$ wget http://mecab.googlecode.com/files/mecab-ipadic-2.7.0-20070801.tar.gz $ tar xzvf mecab-ipadic-2.7.0-20070801.tar.gz $ cd mecab-ipadic-2.7.0-20070801 $ ./configure --with-charset=utf8 $ make $ sudo make install
辞書の作成でmecabのライブラリを使用するため、LD_LIBRARY_PATHに/usr/local/libを追加 します。
.bash_profileに以下の2行を追加してください。
LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/lib export LD_LIBRARY_PATH
辞書のダウンロードとインストールは以下の手順で行います。
$ wget http://mecab.googlecode.com/files/mecab-ipadic-2.7.0-20070801.tar.gz $ tar xzvf mecab-ipadic-2.7.0-20070801.tar.gz $ cd mecab-ipadic-2.7.0-20070801 $ ./configure --with-charset=utf8 $ make $ sudo make install
これで、MeCabが動くようになりましたので、先に進む前に動作を確認しておきます。
「これはテストです。」と改行を入力した後に、Ctrl-Dを入力すると以下のように出力されます。
$ mecab これはテストです。 これ 名詞,代名詞,一般,*,*,*,これ,コレ,コレ は 助詞,係助詞,*,*,*,*,は,ハ,ワ テスト 名詞,サ変接続,*,*,*,*,テスト,テスト,テスト です 助動詞,*,*,*,特殊・デス,基本形,です,デス,デス 。 記号,句点,*,*,*,*,。,。,。 EOS
Sageで使えるようにpython-mecabをSageにインストールします。
以下、Sageのインストールディレクトリを/usr/local/sageと説明しますので、適宜読み替えてください。
Sageにpython用パッケージをインストールする場合には、sageを-pythonオプションで起動します。
以下にpython-mecabのインストール手順を示します。
$ wget http://sourceforge.net/projects/mecab/files/mecab-python/0.98/mecab-python-0.98.tar.gz $ tar xzvf mecab-python-0.98.tar.gz $ cd mecab-python-0.98 $ /usr/local/sage/sage -python setup.py build $ /usr/local/sage/sage -python setup.py install
sageでの動作確認は、次のように行います。
ワークシートで以下のように入力すると、
import sys import MeCab m = MeCab.Tagger ("-Ochasen") print m.parse ("これはテストです。")
以下のような結果が表示されれば、完成です。
これ コレ これ 名詞-代名詞-一般 は ハ は 助詞-係助詞 テスト テスト テスト 名詞-サ変接続 です デス です 助動詞 特殊・デス 基本形 。 。 。 記号-句点 EOS
ついでにfeedparserもインストールします。
pthon-mecabと同様に以下のように行います。
$ wget http://feedparser.googlecode.com/files/feedparser-5.1.2.tar.gz $ tar xzvf feedparser-5.1.2.tar.gz $ cd feedparser-5.1.2 $ /usr/local/sage/sage -python setup.py install
皆様のご意見、ご希望をお待ちしております。