pynlpir进行分词

9 篇文章 0 订阅

中科院分词系统学习

http://blog.csdn.net/hongliryan/article/details/54577670

点击运行会出现下面的错误。

Not valid license or your license expired! Please feel free to contact pipy_zhang@msn.com! 

错误原因是分词系统授权过期

打开NLPIR官网,下载最新版分词器安装包,打开路径,如 20160509171502_ICTCLAS2016分词系统下载包\汉语分词20140928\Data下的NLPIR.user,将自己工程路径下的该文件替换成最新版的NLPIR.user。

官网下载地址

实验代码:

#-*-coding:utf8-*-
import pynlpir  # 引入依赖包
pynlpir.open()  # 打开分词器
s='我是中国人。'
words=pynlpir.segment(s)
print(words)

实验结果:

[('我', 'pronoun'), ('是', 'verb'), ('中国', 'noun'), ('人', 'noun'), ('。', 'punctuation mark')]


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值