ElasticSearch37：初识搜索引擎_query和filter深入对比揭秘：相关度、性能

最新推荐文章于 2023-04-18 14:09:35 发布

一枚程序员

最新推荐文章于 2023-04-18 14:09:35 发布

阅读量274

点赞数

分类专栏： ElasticSearch 文章标签： elasticsearch

本文链接：https://blog.csdn.net/m0_37557582/article/details/78968599

版权

ElasticSearch 专栏收录该内容

60 篇文章 2 订阅

订阅专栏

1.准备数据

PUT /company/employee/1
{
  "address":{
    "province":"zhejiang",
    "city":"wenzhou",
    "country":"china"
  },
  "name":"tom",
  "age":31,
  "join_date":"2015-01-02"
}
PUT /company/employee/2
{
  "address":{
    "province":"zhejiang",
    "city":"hangzhou",
    "country":"china"
  },
  "name":"jerry",
  "age":25,
  "join_date":"2017-01-02"
}
PUT /company/employee/3
{
  "address":{
    "province":"zhejiang",
    "city":"ningbo",
    "country":"china"
  },
  "name":"tiny",
  "age":18,
  "join_date":"2018-01-02"
}

例子，query和filter的实例
搜索要求：
年龄必须大于等于30，同时join_date是2015-01-02

GET /company/employee/_search
{
  "query": {
    "bool": {
      "must": [
        {
          "match": {
            "join_date": "2015-01-02"
          }
        }
      ],
      "filter": {
        "range": {
          "age": {
            "gte": 30
          }
        }
      }
    }
  }
}

执行结果：

{
  "took": 3,
  "timed_out": false,
  "_shards": {
    "total": 5,
    "successful": 5,
    "failed": 0
  },
  "hits": {
    "total": 1,
    "max_score": 1,
    "hits": [
      {
        "_index": "company",
        "_type": "employee",
        "_id": "1",
        "_score": 1,
        "_source": {
          "address": {
            "province": "zhejiang",
            "city": "wenzhou",
            "country": "china"
          },
          "name": "tom",
          "age": 31,
          "join_date": "2015-01-02"
        }
      }
    ]
  }
}

2.filter和query的对比揭秘
filter：仅仅只是按照搜索条件过滤出需要的数据而已，不计算任何相关度分数，对相关度没有任何影响
query：会去计算每个document相对于搜索条件的相关度，并按照相关度进行排序

一般来说，如果你是在进行搜索，需要将最匹配搜索条件的数据先返回，那么使用query；如果你只是要根据一些条件筛选出一部分数据，不关注其排序，那么使用filter。
除非是你的搜索条件，你希望越符合这些搜索条件的document越排在前面，那么这些搜索条件要放在query中，如果你不希望一些搜索条件来影响你的document排序，那么就放到filter中。

3.filter和query的性能
filter，不需要计算相关度分数，不需要按照相关度分数排序，同时还有内置的自动cache最常用filter的数据
query，相反，需要计算相关度分数，需要按照相关度分数排序，而且无法cache结果