如果不想看啰嗦的事由可以直接跳到结论
问题
同事说ES搜索,有些能搜索到,而有些确定是有数据的但是无法搜索出来。
解决问题
重现问题
向同事要了所要搜索的索引 和 字段以及搜索参数,验证下同事使用姿势是否正确。结果果然如同事所说,问题重现,无法匹配。
查看mapping映射以及_analyze API测试
发现这个字段是一个type为text 分词方式为 自定义正则分词器以“,”(逗号)分割。
使用_analyze分词一个测试数据 一切正常
GET picture/_analyze
{
"text": "复式,北欧,2014,1-5W",
"field": "tag3"
}
结果
{
"tokens": [
{
"token": "复式",
"start_offset": 0,
"end_offset": 2,
"type": "word",
"position": 0
},
{
"token": "北欧",
"start_offset": 3,
"end_offset": 5,
"type": "word",
"position": 1
},
{
"token": "2014",
"start_offset": 6,
"end_offset": 10,
"type": "word",
"position": 2
},
{
"token": "1-5w",//注意这里W 已经变成小写了
"start_offset": 11,
"end_offset": 15,
"type": "word",
"position": 3
}
]
}
定位问题
文档存储这边一切正常,那么就是查询的时候 姿势有问题,分析DSL查询语句发现使用的term进行的匹配,上面重现问题中已经发现匹配中文的数据正常,带有字母的就会有问题。term匹配是最小的单位不会处理匹配词,试用match匹配可以成功搜索到数据。match会对匹配词进行处理 譬如分词,大写变小写。经过对比发现,果然文档内存储的是小写字母,而匹配词却是大写字母,所以使用term是无法匹配到数据的。
结论
term是不会处理搜索词,输入什么样就是什么样,所以当使用term进行匹配的时候要注意目标字段是否使用了分词器,注意大小写。