jieba分词自定义词库无效果

首先我自定义了一个词库,内容为:

乾清宫 5
太和殿 3
黄琉璃瓦 3
午门 1
我是一个 5
凯的试接 1

我的分词内容为

故宫的著名景点包括乾清宫、太和殿和黄琉璃瓦等我是一个好孩子我是一个好孩子我是一个好孩子
故宫的著名景点包括乾清宫、太和殿和黄琉璃瓦等凯的试接 
故宫的著名景点包括乾清宫、太和殿和黄琉璃瓦等故宫的著名景点包括乾清宫、太和殿和黄琉璃瓦等
故宫的著名景点包括乾清宫、太和殿和黄琉璃瓦等

分词后的效果:

故宫 的 著名景点 包括 乾清宫 、 太和殿 和 黄琉璃瓦 等 我 是 一个 好孩子 我 是 一个 好孩子 我 是 一个 好孩子 
 故宫 的 著名景点 包括 乾清宫 、 太和殿 和 黄琉璃瓦 等 凯的试接   
 故宫 的 著名景点 包括 乾清宫 、 太和殿 和 黄琉璃瓦 等 故宫 的 著名景点 包括 乾清宫 、 太和殿 和 黄琉璃瓦 等 
 故宫 的 著名景点 包括 乾清宫 、 太和殿 和 黄琉璃瓦 等

对于  我是一个5  这个不想被分开的词,分词后还是被分开了,后来看了jieba自己的分词词典dict.txt,发现在词典中有三个词:我  ,是  ,一个 。所以自己定义的  我是一个  这个词就没有效果了。

添加的  凯的试接  因为dict.txt中没有这个词,就正常执行了。

如果还想按照自己自定义的词典分词,需要把dict.txt中相应的词删掉。

  • 3
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 9
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 9
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值