如何让jieba分词不分开某些词(suggest_freq方法的使用)

问题来源:

本人在进行jpython的jieba分词时,发现在对不高兴,不开心等词汇进行分词时,将其分开下图

Prefix dict has been built succesfully.
[精确模式]:  我 不 喜欢 也 不 高兴
[Finished in 1.7s]

 

期望形式:

但是我们希望jieba应该分成这种形式,不和高兴是连在一起的来表示消极的程度副词

Prefix dict has been built succesfully.
[精确模式]:  我 不喜欢 也 不高兴
[Finished in 1.6s]

 

解决办法: 

jieba有三种方法解决就是自定义字典添加新词汇

#方法1:添加词典文件,文件需要有特定格式,并且为UTF-8编码。
jieba.load_userdict(file_name)

#文件格式如下:单词  词频   词性

创新办 3 i
云计算 5
凱特琳 nz
台中

#方法2:动态修改词频
jieba.add_word(word, freq=None, tag=None)
jieba.del_word(word, freq=None, tag=None)


#方法3:动态修改词频
#调节单个词语的词频,使其能(不能)被分出来。
jieba.suggest_freq(segment, tune=True)

 

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

拼命_小李

给点鼓励

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值