Elasticsearch的查询器query与过滤器filter的区别

最新推荐文章于 2024-04-16 20:00:30 发布

matl1990

最新推荐文章于 2024-04-16 20:00:30 发布

阅读量3.7k

点赞数

分类专栏： Elasticsearch 文章标签： elasticsearch query filter

本文链接：https://blog.csdn.net/matl1990/article/details/52462488

版权

Elasticsearch 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

1.过滤器（filter）

通常用于过滤文档的范围，比如某个字段是否属于某个类型，或者是属于哪个时间区间。例如：1）创建日期是否在2014-2015年间； 2）status字段是否为succes； 3）lat_lon字段是否在某个坐标的10公里范围内？

查询示例：
<pre class="prettyprint xml">{
    "size": 0,
    "filter": {
        "bool": {
            "must": [
                {
                    "terms": {
                        "keyword": [
                            "手机",
                            "iphone"
                        ]
                    }
                },
                {
                    "range": {
                        "cdate": {
                            "gt": "2015-11-09T11:00:00"
                        }
                    }
                }
            ]
        }
    }
}

2.查询器（query）

query的使用方法像极了filter，但query更倾向于更准确的查找。例如：1）与full text search的匹配度最高 2）正则匹配 3）包含run单词，如果包含这些单词：runs、running、jog、sprint，也被视为包含run单词 4）包含quick、brown、fox。这些词越接近，这份文档的相关性就越高

查询器会计算出每份文档对于某次查询有多相关（relevant），然后分配文档一个相关性分数：_score。而这个分数会被用来对匹配了的文档进行相关性排序。相关性概念十分适合全文搜索（full-text search），这个很难能给出完整、“正确”答案的领域。

查询示例：
{
    "size": 1,
    "query": {
        "bool": {
            "must": [
                {
                    "terms": {
                        "keyword": [
                            "手机",
                            "iphone"
                        ]
                    }
                },
                {
                    "range": {
                        "cdate": {
                            "gt": "2015-11-09T11:00:00"
                        }
                    }
                }
            ]
        }
    }
}

3.性能区别

filter是不计算相关性的，同时可以cache。因此，filter速度要快于query。

4.两者结合

使用query和filter查询的话，需要使用 {query:{filtered：{}}} 来包含这两个查询语法。他们的好处是，借助于filter的速度可以快速过滤出文档，然后再由query根据条件来匹配。

示例如下：


{   "size":0,    
    "query": {
        "filtered": {
            "query": {
                "bool": {
                    "should": [],
                    "must_not": [
                       
                    ],
                    "must": [
                        {
                         "term": {
                             
                                "channel_name":"微信自媒体微信"
                            }
                        }
                   
                    ]
                }
            }

        }，
        "filter":{
            "range": {
                "idate": {
                    "gte": "2015-09-01T00:00:00",
                    "lte": "2015-09-10T00:00:00"
                    
                    }
                }
        }
    }
}

我们这业务上关于elasticsearch的查询语法基本都是用query filtered方式进行的，我也推荐大家直接用这样的方法。should ，must_not, must 都是列表，列表里面可以写多个条件。这里再啰嗦一句，如果你的查询是范围和类型比较粗大的，用filter ！如果是那种精准的，就用query来查询。

{

”bool”:{

”should”:[],   #相当于OR条件

”must_not”:[],  #必须匹配的条件，这里的条件都会被反义

”must”:[]        #必须要有的

}

}

matl1990

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Elasticsearch的查询器query与过滤器filter的区别

elasticsearch的查询器query与过滤器filter的区别
复制链接

扫一扫

专栏目录

Elasticsearch的查询器query与过滤器filter的区别

“相关推荐”对你有帮助么？