es基于ik分词器“长”关键字wildcard匹配不到数据

《一线大厂Java面试题解析+核心总结学习笔记+最新讲解视频+实战项目源码》点击传送门,即可获取!

POST /lpm-company-dev/_search

{

“query”:{

“bool” : {

“must” : [

{

“bool” : {

“should” : [

{

“wildcard” : {

“name” : {

“wildcard” : “鸿运”,

“boost” : 1.0

}

}

}

],

“adjust_pure_negative” : true,

“boost” : 1.0

}

}

],

“adjust_pure_negative” : true,

“boost” : 1.0

}

}

}

关键词为“鸿运”可以搜索到数据,但是“鸿运物流”却搜索不到。

二、问题分析


mapping分词器设置

“name”: {

“type”: “text”,

“analyzer”: “ik_max_word”,

“search_analyzer”: “ik_smart”

}

分析

ik_max_word解析结果:

POST /lpm-company-dev/_analyze

{

“text”: [

“阜阳市鸿运物流有限公司”

],

“analyzer”: “ik_max_word”

}

分析结果:

{

“tokens” : [

{

“token” : “阜阳市”,

“start_offset” : 0,

“end_offset” : 3,

“type” : “CN_WORD”,

“position” : 0

},

{

“token” : “阜阳”,

“start_offset” : 0,

“end_offset” : 2,

“type” : “CN_WORD”,

“position” : 1

},

{

“token” : “市”,

“start_offset” : 2,

“end_offset” : 3,

“type” : “CN_CHAR”,

“position” : 2

},

{

“token” : “鸿运”,

“start_offset” : 3,

“end_offset” : 5,

“type” : “CN_WORD”,

“position” : 3

},

{

“token” : “物流”,

“start_offset” : 5,

“end_offset” : 7,

“type” : “CN_WORD”,

“position” : 4

},

{

“token” : “有限公司”,

“start_offset” : 7,

“end_offset” : 11,

“type” : “CN_WORD”,

“position” : 5

},

{

“token” : “有限”,

“start_offset” : 7,

“end_offset” : 9,

“type” : “CN_WORD”,

“position” : 6

},

{

“token” : “公司”,

“start_offset” : 9,

“end_offset” : 11,

“type” : “CN_WORD”,

“position” : 7

}

]

}

ik_smart解析结果:

POST /lpm-company-dev/_analyze

{

“text”: [

“阜阳市鸿运物流有限公司”

],

“analyzer”: “ik_smart”

}

{

“tokens” : [

{

“token” : “阜阳市”,

“start_offset” : 0,

“end_offset” : 3,

“type” : “CN_WORD”,

“position” : 0

},

{

“token” : “鸿运”,

“start_offset” : 3,

“end_offset” : 5,

“type” : “CN_WORD”,

“position” : 1

},

{

“token” : “物流”,

“start_offset” : 5,

“end_offset” : 7,

“type” : “CN_WORD”,

“position” : 2

},

{

“token” : “有限公司”,

“start_offset” : 7,

“end_offset” : 11,

“type” : “CN_WORD”,

“position” : 3

}

]

}

三、猜想


技术学习总结

学习技术一定要制定一个明确的学习路线,这样才能高效的学习,不必要做无效功,既浪费时间又得不到什么效率,大家不妨按照我这份路线来学习。

最后面试分享

大家不妨直接在牛客和力扣上多刷题,同时,我也拿了一些面试题跟大家分享,也是从一些大佬那里获得的,大家不妨多刷刷题,为金九银十冲一波!

《一线大厂Java面试题解析+核心总结学习笔记+最新讲解视频+实战项目源码》点击传送门,即可获取!
x-1714421353318)]

[外链图片转存中…(img-c0o215YT-1714421353318)]

[外链图片转存中…(img-WaZD2Fam-1714421353318)]

最后面试分享

大家不妨直接在牛客和力扣上多刷题,同时,我也拿了一些面试题跟大家分享,也是从一些大佬那里获得的,大家不妨多刷刷题,为金九银十冲一波!

[外链图片转存中…(img-C2ondFaa-1714421353319)]

[外链图片转存中…(img-DkehYEzA-1714421353319)]

《一线大厂Java面试题解析+核心总结学习笔记+最新讲解视频+实战项目源码》点击传送门,即可获取!

  • 20
    点赞
  • 21
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
### 回答1: ElasticsearchIK分词器是一种中文分词器,可以将中文文本分成一个个有意义的词语,以便于搜索和分析。它支持细粒度和粗粒度两种分词模式,可以根据不同的需求进行配置。IK分词器还支持自定义词典和停用词,可以提高分词的准确性和效率。在Elasticsearch中,IK分词器是非常常用的中文分词器之一。 ### 回答2: Elasticsearch是一个开源的搜索引擎,旨在提供实时搜索和分析功能。作为强大的搜索引擎,Elasticsearch极大的依赖于高效的分词器。而其中IK分词器是目前常见的分词器之一。 IK分词器是一款用于中文分词的工具。它采用了一种基于规则和词库相结合的分词算法。通常情况下,IK分词器的工作流程是:首先,将文本按照信息增益、词频、文本跨度等属性计算得到其初始的分词结果。然后,IK分词器通过对分词结果进行多轮处理,逐渐优化分词结果,以达到更为准确、严谨的分词效果。 此外,IK分词器还具备一些较为强大的功能。例如,支持中文姓名、词语拼音、数字、英文、日文等的分词处理。支持自定义词典、停用词、同义词等配置。支持了多种分词模式,如细粒度分词模式,搜索引擎分词模式和最少分词模式等等。这些功能的不断完善和升级,使IK分词器逐渐成为在中文文本分析领域常用的分词器之一。 总体来说,IK分词器Elasticsearch中的应用是非常广泛的,它不仅能够提高搜索效果,而且还能加强文本拓展和分析的功能。随着数据量的不断增和应用场景的不断拓展,对于一款高效、灵活的分词器的需求越来越大。相信IK分词器在未来的应用中,会有更加广泛的空间和应用。 ### 回答3: Elasticsearchik分词器是一种常用的中文全文检索分词器,能够对中文文本进行分词,将整篇文本划分成有意义的词语,并且支持多种分词模式。 该分词器的优点在于,它采用了基于词典和规则的分词算法,对中文分词效果非常好,特别是对于一些细分领域的专业术语等难分难识的词汇,在ik分词器的支持下也能够准确地被识别和分词。另外,ik分词器还支持自定义词典,可以根据应用场景自定义添加词汇,进一步提高分词效果和搜索准确率。 除此之外,ik分词器还支持多种分词模式,包括最细粒度分词模式、普通分词模式、搜索分词模式和面向中文搜索的ik_smart分词模式等,可以根据实际需求进行选择和配置。 总之,ik分词器Elasticsearch中一个非常实用的中文分词组件,对于中文全文检索和搜索应用具有重要的作用,可以提高搜索效果、加速搜索响应速度,为用户提供更加优质的搜索服务。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值