Elasticsearch 模糊查询 wildcard、regexp、prefix选型

之前讲过Elasticsearch 的wildcard(通配符查询)、regexp(正则查询)、prefix(前缀查询),他们都是致力于模糊搜索,然后在实际的项目中该如何选择,稍不注意就可能到很大性能问题。

使用方式这里就不再赘述了,他们都是基于词条查询,它们也需要遍历倒排索引中的词条列表来找到所有的匹配词条,然后逐个词条地收集对应的文档ID。

针对Numeric datatypes(long, integer, short, byte, double, float....)

基本上不要使用,那样做意义真的不大,另外要关注下数值类型和Term Query有重大变化的介绍。

针对文本类型text和keyword)

这一类大概是主流需求,

当搜索字段是text类型时由于它会分词在执行wildcard、regexp、prefix时和es会检查字段中的每个词条,而不是整个字段。

当搜索字段是keyword类型时在执行wildcard、regexp、prefix时和es会检查字段中整个文本

prefix查询

如果满足你的需求,前缀匹配是优于wildcard和regexp。

regexp查询和wildcard查询

避免使用一个以通配符开头的模式(比如,*foo或者正则表达式: .*foo),运行这类查询是非常消耗资源的。

最后再提醒下,如果你想了解它的执行过程及耗时情况(优化项从这里分析),查询是添加profile语法

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值