Ubuntu安装日文分词工具MeCab
安装mecab
sudo apt install mecab
sudo apt install libmecab-dev
sudo apt install mecab-ipadic-utf8
测试是否正常运行
$ mecab
特急はくたか
特急 名詞,一般,*,*,*,*,特急,トッキュウ,トッキュー
はくたか 名詞,固有名詞,一般,*,*,*,はくたか,ハクタカ,ハクタカ
EOS
安装python的mecab API
pip3 install mecab-python3
测试
import MeCab
mecab = MeCab.Tagger ("-Ochasen")
print(mecab.parse("pythonが大好きです"))
mecab = MeCab.Tagger ("'-Owakati'")
print(mecab.parse("pythonが大好きです"))
参考文献
https://github.com/SamuraiT/mecab-python3