首先安装安装Java运行环境:
sudo apt-get install default-jre
sudo apt-get install default-jdk
之后需要安装最新的版本的nltk,新
版的
已经提供了相应的斯坦福文本处理工具接口,包括词性标注,命名实体识别和句法分析器的接口:
git clone https://github.com/nltk/nltk
cd nltk
安装好之后,你需要下载斯坦福中文分词其sudo python setup.py install