背景:同事突然线上出了bug,在测试环境正常上了生产查询不出来数据。因为业务是日志相关,数据入es都是直接放到索引下而不是构建mapping,所以字段A的类型是text,fields是keyword。查询方式使用terms查询。
分析:
通过_analyze可以看出该此被分词解析成全小写
通过建立一个定义好类型是keyword的字段A查询后发现被分词解析成与值完全一致
因此猜测,测试环境的数据应该都是全小写的,所以测试环境正常,生产环境查不到。后面也验证了确实是这样
所以将字段后加上.keyword应该会解决该问题,通过验证确实如此
根据以上思路,将值转换成小写不加.keyword也可以查到,通过验证确实如此
原因:
1. 类型text与keyword的区别
text:会进行分词且分词后才建立索引、模糊匹配、分词后精确匹配、不能聚合
keyword:不分词整词建立索引、不能模糊匹配、可以聚合
2. ES的terms查询是精确查询,直接用字段搜索相当于用text类型,被分词后变成全小写精确匹配时不能找到对应的数据
加上.keyword后相当于使用keyword类型,分词后与原值相同精确匹配时可以找到对应的数据
方案1:需要加上.keyword
方案2:后面的值转成小写