Mecabでキーワード自動リンク(Python編)
ウノウラボ Unoh Labs: PHPとMecabでキーワード自動リンクを実装する
上記の記事ではPHPでの使い方を紹介しましたが、もちろんPythonでも簡単にできます。1.mecabインストールと2.自動リンク用辞書の作成は、同じなのでここでは省略します。
3.Mecabモジュールのインストール
# yum install python-mecab
はい、完了。
4.動作確認
次のようなプログラムを書いて実行します。
import MeCab
t = MeCab.Tagger("-d /usr/lib/mecab/autolink")
str = '京都についてGoogleとYahooで検索した。'
print t.parse(str)
実行結果
$ python autolink.py <a href="http://www.city.kyoto.jp/">京都</a>について <a href="http://www.google.com/">Google</a>と <a href="http://www.yahoo.com/">Yahoo</a>で検索した。
このようにPHPと同じかそれ以上にとても簡単です。
Pythonの場合は、他にTernary Search Tree(TST)のデータ構造を利用したpytstもあるのですが、日本語のことを考えるとMecabかDartsのほうが安心かと。
また、さらなる高速化を追い求める人は、 cmecab -- Mecab-Python高速バインディング というのもあるので、こちらも試してみると楽しいかもしれません。









