pynlpir(ICTCLAS)初步使用

# -*- coding:utf-8 -*-
import pynlpir  # 引入依赖包
pynlpir.open()  # 打开分词器
# s = 'NLPIR分词系统前身为2000年发布的ICTCLAS词法分析系统,从2009年开始,为了和以前工作进行大的区隔,并推广NLPIR自然语言处理与信息检索共享平台,调整命名为NLPIR分词系统。'  # 实验文本
s='我想听刘德华的笨小孩'
pynlpir.segment(s)  # 默认打开分词和词性标注功能
print(pynlpir.segment(s))
pynlpir.segment(s, pos_english=False)   # 把词性标注语言变更为汉语
pynlpir.segment(s, pos_tagging=False)   # 使用pos_tagging来关闭词性标注
from ctypes import c_char_p
pynlpir.nlpir.AddUserWord(c_char_p("自定义词汇".encode()))
pynlpir.close()


输出结果:




[('我', 'pronoun'), ('想', 'verb'), ('听', 'verb'), ('刘德华', 'noun'), ('的', 'particle'), ('笨', 'adjective'), ('小孩', 'noun')]


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值