es 默认排序字段_ElasticSearch(7)-排序

本文深入探讨ElasticSearch的排序机制,包括默认的相关性排序和自定义字段值排序。通过示例展示了如何使用sort参数进行时间、_score和其他字段的排序,强调了多级排序和字符串字段的排序策略。此外,还介绍了ElasticSearch中的相关性计算,包括TF/IDF算法,以及explain参数在调试查询时的作用。最后,讨论了数据字段及其在排序和聚合中的作用,以及内存管理的重要性。
摘要由CSDN通过智能技术生成

一、排序

相关性排序

默认情况下,结果集会按照相关性进行排序 -- 相关性越高,排名越靠前。 这一章我们会讲述相关性是什么以及它是如何计算的。 在此之前,我们先看一下sort参数的使用方法。

排序方式

为了使结果可以按照相关性进行排序,我们需要一个相关性的值。在ElasticSearch的查询结果中, 相关性分值会用_score字段来给出一个浮点型的数值,所以默认情况下,结果集以_score进行倒序排列。

有时,即便如此,你还是没有一个有意义的相关性分值。比如,以下语句返回所有tweets中 user_id 是否 包含值 1:

GET /_search

{

"query" : {

"filtered" : {

"filter" : {

"term" : {

"user_id" : 1

}

}

}

}

}

过滤语句与 _score没有关系,但是有隐含的查询条件 match_all为所有的文档的 _score设值为 1。 也就相当于所有的文档相关性是相同的。

字段值排序

下面例子中,对结果集按照时间排序,这也是最常见的情形,将最新的文档排列靠前。 我们使用 sort 参数进行排序:

GET /_search

{

"query" : {

"filtered" : {

"filter" : { "term" : { "user_id" : 1 }}

}

},

"sort": { "date": { "order": "desc" }}

}

你会发现这里有两个不同点:

"hits" : {

"total" : 6,

"max_score" : null, <1>

"hits" : [ {

"_index" : "us",

"_type" : "tweet",

"_id" : "14",

"_score" : null, <1>

"_source" : {

"date": "2014-09-24",

...

},

"sort" : [ 1411516800000 ] <2>

},

...

}

_score字段没有经过计算,因为它没有用作排序。date 字段被转为毫秒当作排序依据。

首先,在每个结果中增加了一个 sort 字段,它所包含的值是用来排序的。

在这个例子当中 date字段在内部被转为毫秒,即长整型数字1411516800000等同于日期字符串2014-09-24 00:00:00 UTC。

其次就是 _score和 max_score 字段都为 null。

计算 _score 是比较消耗性能的, 而且通常主要用作排序 -- 我们不是用相关性进行排序的时候,就不需要统计其相关性。 如果你想强制计算其相关性,可以设置track_scores为 true。

默认排序

你可以只指定要排序的字段名称:

"sort": "number_of_ch

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值