1.准备数据
例子,query和filter的实例
搜索要求:
年龄必须大于等于30,同时join_date是2015-01-02
执行结果:
2.filter和query的对比揭秘
filter:仅仅只是按照搜索条件过滤出需要的数据而已,不计算任何相关度分数,对相关度没有任何影响
query:会去计算每个document相对于搜索条件的相关度,并按照相关度进行排序
一般来说,如果你是在进行搜索,需要将最匹配搜索条件的数据先返回,那么使用query;如果你只是要根据一些条件筛选出一部分数据,不关注其排序,那么使用filter。
除非是你的搜索条件,你希望越符合这些搜索条件的document越排在前面,那么这些搜索条件要放在query中,如果你不希望一些搜索条件来影响你的document排序,那么就放到filter中。
3.filter和query的性能
filter,不需要计算相关度分数,不需要按照相关度分数排序,同时还有内置的自动cache最常用filter的数据
query,相反,需要计算相关度分数,需要按照相关度分数排序,而且无法cache结果
PUT /company/employee/1
{
"address":{
"province":"zhejiang",
"city":"wenzhou",
"country":"china"
},
"name":"tom",
"age":31,
"join_date":"2015-01-02"
}
PUT /company/employee/2
{
"address":{
"province":"zhejiang",
"city":"hangzhou",
"country":"china"
},
"name":"jerry",
"age":25,
"join_date":"2017-01-02"
}
PUT /company/employee/3
{
"address":{
"province":"zhejiang",
"city":"ningbo",
"country":"china"
},
"name":"tiny",
"age":18,
"join_date":"2018-01-02"
}
例子,query和filter的实例
搜索要求:
年龄必须大于等于30,同时join_date是2015-01-02
GET /company/employee/_search
{
"query": {
"bool": {
"must": [
{
"match": {
"join_date": "2015-01-02"
}
}
],
"filter": {
"range": {
"age": {
"gte": 30
}
}
}
}
}
}
执行结果:
{
"took": 3,
"timed_out": false,
"_shards": {
"total": 5,
"successful": 5,
"failed": 0
},
"hits": {
"total": 1,
"max_score": 1,
"hits": [
{
"_index": "company",
"_type": "employee",
"_id": "1",
"_score": 1,
"_source": {
"address": {
"province": "zhejiang",
"city": "wenzhou",
"country": "china"
},
"name": "tom",
"age": 31,
"join_date": "2015-01-02"
}
}
]
}
}
2.filter和query的对比揭秘
filter:仅仅只是按照搜索条件过滤出需要的数据而已,不计算任何相关度分数,对相关度没有任何影响
query:会去计算每个document相对于搜索条件的相关度,并按照相关度进行排序
一般来说,如果你是在进行搜索,需要将最匹配搜索条件的数据先返回,那么使用query;如果你只是要根据一些条件筛选出一部分数据,不关注其排序,那么使用filter。
除非是你的搜索条件,你希望越符合这些搜索条件的document越排在前面,那么这些搜索条件要放在query中,如果你不希望一些搜索条件来影响你的document排序,那么就放到filter中。
3.filter和query的性能
filter,不需要计算相关度分数,不需要按照相关度分数排序,同时还有内置的自动cache最常用filter的数据
query,相反,需要计算相关度分数,需要按照相关度分数排序,而且无法cache结果