java ES 分组求均值_es 区间聚合

环境信息

以下是本次实战的环境信息,请确保您的Elasticsearch可以正常运行:

操作系统:Ubuntu 18.04.2 LTS

JDK:1.8.0_191

Elasticsearch:6.7.1

Kibana:6.7.1

实战用的数据依然是一些汽车销售的记录,在第一章有详细的导入步骤,请参考操作,导入后您的es中的数据如下图:

73ef7f487a41

在这里插入图片描述

本章概要

本篇实战的聚合操作有以下内容:

指定字段的区间聚合;

时间字段的区间聚合;

扩展实战;

接下来开始实战吧。

条形图(histogram桶)

还记得terms桶么,用来将指定字段值相同的文档聚合在一个桶中,而histogram桶是将指定字段值在某个范围内的文档聚合在一个桶中,如下图所示,0-19999是一个桶,11000和15000在一个桶内,23000和31000在一个桶内,这就是histogram桶:

73ef7f487a41

在这里插入图片描述

以汽车销售记录为例做一次聚合查询,为售价创建histogram桶,以20000作为间隔,每个桶负责的区间如上图所示,相关的销售记录就会被放入对应的桶中,请求参数和说明如下:

GET /cars/transactions/_search

{

"size":0, ---令返回值的hits对象为空

"aggs":{ ---聚合命令

"price":{ ---聚合字段名称

"histogram": { ---桶类型

"field": "price", ---指定price字段的值作为判断条件

"interval": 20000 ---每个桶负责的区间大小为20000

}

}

}

}

es返回的数据和说明如下:

{

"took" : 57,

"timed_out" : false,

"_shards" : {

"total" : 5,

"successful" : 5,

"skipped" : 0,

"failed" : 0

},

"hits" : {

"total" : 8,

"max_score" : 0.0,

"hits" : [ ]

},

"aggregations" : { ---聚合结果

"price" : { ---请求参数中指定的名称

"buckets" : [ ---price桶的数据在此数组中

{

"key" : 0.0, ---第一个桶,区间[0-19999],0.0是起始值

"doc_count" : 3 ---这个区间有三个文档(price值分别是10000、12000、15000)

},

{

"key" : 20000.0, ---第二个桶,区间[20000-39999],20000.0是起始值

"doc_count" : 4 ---这个区间有四个文档

},

{

"key" : 40000.0, ---第三个桶,区间[40000-59999],40000.0是起始值

"doc_count" : 0 ---这个区间没有文档

},

......

控制空桶是否返回

在上面的返回值中,第三个桶中没有文档,在有的业务场景中,我们不需要没有数据的桶,此时可以用min_doc_count参数来控制,如果min_doc_count等于2,表示桶中最少有两条记录才会出现在返回内容中,如下所示,min_doc_count如果等于1&

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值