最全es基于ik分词器“长”关键字wildcard匹配不到数据,阿里,腾讯,PDD等大厂Java面试真题

面试资料整理汇总

成功从小公司跳槽进蚂蚁定级P7,只因刷了七遍这些面试真题

成功从小公司跳槽进蚂蚁定级P7,只因刷了七遍这些面试真题

这些面试题是我朋友进阿里前狂刷七遍以上的面试资料,由于面试文档很多,内容更多,没有办法一一为大家展示出来,所以只好为大家节选出来了一部分供大家参考。

面试的本质不是考试,而是告诉面试官你会做什么,所以,这些面试资料中提到的技术也是要学会的,不然稍微改动一下你就凉凉了

在这里祝大家能够拿到心仪的offer!

本文已被CODING开源项目:【一线大厂Java面试题解析+核心总结学习笔记+最新讲解视频+实战项目源码】收录

需要这份系统化的资料的朋友,可以点击这里获取

关键词为“鸿运”可以搜索到数据,但是“鸿运物流”却搜索不到。

二、问题分析


mapping分词器设置

“name”: {

“type”: “text”,

“analyzer”: “ik_max_word”,

“search_analyzer”: “ik_smart”

}

分析

ik_max_word解析结果:

POST /lpm-company-dev/_analyze

{

“text”: [

“阜阳市鸿运物流有限公司”

],

“analyzer”: “ik_max_word”

}

分析结果:

{

“tokens” : [

{

“token” : “阜阳市”,

“start_offset” : 0,

“end_offset” : 3,

“type” : “CN_WORD”,

“position” : 0

},

{

“token” : “阜阳”,

“start_offset” : 0,

“end_offset” : 2,

“type” : “CN_WORD”,

“position” : 1

},

{

“token” : “市”,

“start_offset” : 2,

“end_offset” : 3,

“type” : “CN_CHAR”,

“position” : 2

},

{

“token” : “鸿运”,

“start_offset” : 3,

“end_offset” : 5,

“type” : “CN_WORD”,

“position” : 3

},

{

“token” : “物流”,

“start_offset” : 5,

“end_offset” : 7,

“type” : “CN_WORD”,

“position” : 4

},

{

“token” : “有限公司”,

“start_offset” : 7,

“end_offset” : 11,

“type” : “CN_WORD”,

“position” : 5

},

{

“token” : “有限”,

“start_offset” : 7,

“end_offset” : 9,

“type” : “CN_WORD”,

“position” : 6

},

{

“token” : “公司”,

“start_offset” : 9,

“end_offset” : 11,

“type” : “CN_WORD”,

“position” : 7

}

]

}

ik_smart解析结果:

POST /lpm-company-dev/_analyze

{

“text”: [

“阜阳市鸿运物流有限公司”

],

“analyzer”: “ik_smart”

}

{

“tokens” : [

{

“token” : “阜阳市”,

“start_offset” : 0,

“end_offset” : 3,

“type” : “CN_WORD”,

“position” : 0

},

{

“token” : “鸿运”,

“start_offset” : 3,

“end_offset” : 5,

“type” : “CN_WORD”,

“position” : 1

},

{

“token” : “物流”,

“start_offset” : 5,

“end_offset” : 7,

“type” : “CN_WORD”,

“position” : 2

},

{

“token” : “有限公司”,

“start_offset” : 7,

“end_offset” : 11,

“type” : “CN_WORD”,

“position” : 3

}

]

}

三、猜想


ik分词之后,wildcard就不能正常使用了?目前经过测试,答案正是如此;我们又没有太多的精力来维护ik分词器的词典。

修改属性配置

于是重建索引,不再使用ik分词器,关键字段设置为:

文末

我将这三次阿里面试的题目全部分专题整理出来,并附带上详细的答案解析,生成了一份PDF文档

  • 第一个要分享给大家的就是算法和数据结构

网易严选Java开发三面面经:HashMap+JVM+索引+消息队列

  • 第二个就是数据库的高频知识点与性能优化

网易严选Java开发三面面经:HashMap+JVM+索引+消息队列

  • 第三个则是并发编程(72个知识点学习)

网易严选Java开发三面面经:HashMap+JVM+索引+消息队列

  • 最后一个是各大JAVA架构专题的面试点+解析+我的一些学习的书籍资料

网易严选Java开发三面面经:HashMap+JVM+索引+消息队列

还有更多的Redis、MySQL、JVM、Kafka、微服务、Spring全家桶等学习笔记这里就不一一列举出来

本文已被CODING开源项目:【一线大厂Java面试题解析+核心总结学习笔记+最新讲解视频+实战项目源码】收录

需要这份系统化的资料的朋友,可以点击这里获取

是各大JAVA架构专题的面试点+解析+我的一些学习的书籍资料**

[外链图片转存中…(img-l2O3inwI-1715554173932)]

还有更多的Redis、MySQL、JVM、Kafka、微服务、Spring全家桶等学习笔记这里就不一一列举出来

本文已被CODING开源项目:【一线大厂Java面试题解析+核心总结学习笔记+最新讲解视频+实战项目源码】收录

需要这份系统化的资料的朋友,可以点击这里获取

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值