Ubuntu安装日文分词工具MeCab

安装mecab

sudo apt install mecab
sudo apt install libmecab-dev
sudo apt install mecab-ipadic-utf8

测试是否正常运行

$ mecab
特急はくたか
特急    名詞,一般,*,*,*,*,特急,トッキュウ,トッキュー
はくたか        名詞,固有名詞,一般,*,*,*,はくたか,ハクタカ,ハクタカ
EOS

安装python的mecab API

pip3 install mecab-python3

测试

import MeCab
mecab = MeCab.Tagger ("-Ochasen")
print(mecab.parse("pythonが大好きです"))

mecab = MeCab.Tagger ("'-Owakati'")
print(mecab.parse("pythonが大好きです"))


参考文献

https://github.com/SamuraiT/mecab-python3

https://qiita.com/ekzemplaro/items/c98c7f6698f130b55d53

https://blog.csdn.net/willduan1/article/details/68945327