PyNLPIR python中文分词工具


        NLPIR分词系统前身为2000年发布的ICTCLAS词法分析系统,从2009年开始,为了和以前工作进行大的区隔,并推广NLPIR自然语言处理与信息检索共享平台,调整命名为NLPIR分词系统。    
        其主要的功能有中文分词,标注词性和获取句中的关键词。
        主要用到的函数有两个:  pynlpir. segment ( s pos_tagging=True pos_names='parent' pos_english=True )
                                                   pynlpir.get_key_words(smax_words=50weighted=False)
           分词: pynlpir. segment ( s pos_tagging=True pos_names='parent' pos_english=True
                S: 句子    
                pos_tagging:是否进行词性标注    
                pos_names:显示词性的父类(parent)还是子类(child) 或者全部(all)   
                pos_english:词性显示英语还是中文
            获取关键词:pynlpir.get_key_words(smax_words=50weighted=False)
                s: 句子
                max_words:最大的关键词数
                weighted:是否显示关键词的权重
 
   import pynlpirimport jiebapynlpir.open()s = '最早的几何学兴起于公元前7世纪的古埃及'# s = 'hscode为0110001234的进口'segments = pynlpir.segment(s, pos_names='all',pos_english=False)for segment in segments: print (segment[0], '\t', segment[1])key_words = pynlpir.get_key_words(s, weighted=True)for key_word in key_words: print (key_word[0], '\t', key_word[1])pynlpir.close() 
  
            985935-20170921160844603-588199181.png           985935-20170921160844978-1153525387.png
 




转载于:https://www.cnblogs.com/combfish/p/7569111.html

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值