分词方法选择很重要

今天不太忙,就自我检讨一下,平台上有ik_smart,whitespace,standard的分词方法,每次有人字段有中文的时候我都让他们用ik_smart分词,后来用户经常有那种一个名称中缺几个字那样的查询,发现是ik_smart分词总会分不好就直接查不出来,我就建议用户用ik_max_word,因为会分的比较散,然后就总会查出来,后来字段里有英文和数字的时候分的十分的散,怎么都没办法了,后来还是用户问我可以用standard单字分词吗,我才豁然开朗,啊,浪费了自己和用户很多时间哎,以后要注意啦
 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值