jie ba分词

本文介绍了jieba分词库的使用,包括.cut()函数的全模式、精准模式和搜索引擎模式,以及.posseg()函数进行词性标注。同时,讲解了如何添加自定义词汇,以及利用jieba提取频率最高的关键词。
摘要由CSDN通过智能技术生成

1 .cut()函数,将句子进行分词
.cut(待处理的句子,处理时使用的模式)
全模式jieba.cut(sentence,cut_all =True):分的词比较全,但词汇可能有叠加
在这里插入图片描述
精准模式jieba.cut(sentence,cut_all=False),与全模式相对立,词汇无叠加
在这里插入图片描述
搜索引擎模式jieba.cut_for_search(语句)
在这里插入图片描述

对于输出,需要通过循环将其遍历出来

for item in w1:
    print(item)

2 .posseg()函数,进行词性标注
a:形容词
c:连词
d:副词
e:叹词
f:方位词
i:成语
m:数词
n:名词
nr:人名
ns:地名
nt:机构团体
p:介词
r:代词
t:时间
u:助词
v:动词
vn:名动词
w:标点符号
un:未知词

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值