DSL实现Bucket聚合

其然乐衣

已于 2022-07-23 21:44:07 修改

阅读量284

点赞数

分类专栏： springcloud elasticsearch 文章标签：大数据 elasticsearch

于 2022-07-13 15:30:00 首次发布

本文链接：https://blog.csdn.net/QRLYLETITBE/article/details/125764672

版权

springcloud 同时被 2 个专栏收录

50 篇文章 2 订阅

订阅专栏

elasticsearch

16 篇文章 0 订阅

订阅专栏

聚合（aggregations）可以实现对文档数据的统计、分析、运算。聚合常见的有三类：

桶（Bucket）聚合：用来对文档做分组

•TermAggregation：按照文档字段值分组

•Date Histogram：按照日期阶梯分组，例如一周为一组，或者一月为一组

1、DSL实现Bucket聚合

我们要统计所有数据中的品牌有几种，此时可以根据品牌的名称做聚合。

类型为term类型，DSL示例：

# 聚合功能
GET /hotel/_search
{
  "size": 0,  // 设置size为0，结果中不包含文档，只包含聚合结果
  "aggs": { // 定义聚合
    "brandAgg": { //给聚合起个名字
      "terms": { // 聚合的类型，按照品牌值聚合，所以选择term
        "field": "brand", // 参与聚合的字段
        "size": 20 // 希望获取的聚合结果数量
      }
    }
  }
}

2、 Bucket聚合-聚合结果排序

默认情况下，Bucket聚合会统计Bucket内的文档数量，记为_count，并且按照_count降序排序。

我们可以修改结果排序方式：

# 聚合功能,自定义排序规则
GET /hotel/_search
{
  "size":0,
  "aggs": {
    "brandAgg": {
      "terms": {
        "field": "brand.keyword",
        "size": 20,
        "order": {
          "_count": "asc"  // 按照_count升序排列
        }
      }
    }
  }
}

3、Bucket聚合-限定聚合范围

默认情况下，Bucket聚合是对索引库的所有文档做聚合的（当数据过于庞大时，会严重影响性能），我们可以限定要聚合的文档范围，只要添加query条件即可

# 聚合功能，限定聚合范围
GET /hotel/_search
{
  "query": {
    "range": {
      "price": {
        "lte": 200   // 只对200元以下的文档聚合
      }
    }
  }, 
  
  "size":0,
  "aggs": {
    "brandAgg": {
      "terms": {
        "field": "brand.keyword",
        "size": 20
        }
      }
    }
  }
}