中科院分词系统学习
http://blog.csdn.net/hongliryan/article/details/54577670
点击运行会出现下面的错误。
Not valid license or your license expired! Please feel free to contact pipy_zhang@msn.com!
错误原因是分词系统授权过期
打开NLPIR官网,下载最新版分词器安装包,打开路径,如 20160509171502_ICTCLAS2016分词系统下载包\汉语分词20140928\Data下的NLPIR.user,将自己工程路径下的该文件替换成最新版的NLPIR.user。
实验代码:
#-*-coding:utf8-*-
import pynlpir # 引入依赖包
pynlpir.open() # 打开分词器
s='我是中国人。'
words=pynlpir.segment(s)
print(words)
实验结果:
[('我', 'pronoun'), ('是', 'verb'), ('中国', 'noun'), ('人', 'noun'), ('。', 'punctuation mark')]