ElasticSearch 学习笔记：聚合(Aggregation) - Top Hits

崔显龙

已于 2023-11-05 16:48:26 修改

阅读量1.3w

点赞数 2

分类专栏： ElasticSearch 文章标签： ElasticSearch ES Top Group Agg

于 2020-02-21 13:19:26 首次发布

本文链接：https://blog.csdn.net/cuixianlong/article/details/104426160

版权

ElasticSearch 专栏收录该内容

5 篇文章 0 订阅

订阅专栏

本文目录

1 功能简介

聚合后，每一个聚合Bucket里面仅返回指定顺序的前N条数据。

2 使用示例

（1）场景示例：

ES库中存储着成员数据，每个成员有自己的编号ID、所属的团队ID和个人得分等数据：id, team_id, score, age...

给定一组团队ID列表：team_id IN (1, 5, 7)

查询每个团队中得分最高的2个人的编号ID。

（2）ES查询示例：

GET .../_search?routing=xxx  // 若已知数据属于某一个或几个路由分区，设置路由会提升性能。
{
  "size": 0,  // 仅过滤数据，不返回命中数据。
  "query": {
    "bool": {
      "filter": [  // 过滤条件，在聚合前先进行数据筛选。
        {
          "terms": {
            "team_id": [
              1,
              5,
              7
            ]
          }
        }
      ]
    }
  },
  "aggs": {
    "group_aggs": {  // 第一层聚合：先按照team_id将数据聚合成多个Bucket。
      "terms": {
        "field": "team_id",
        "execution_hint": "map"  // 若可知该层聚合结果数量很小，设置成map可提升性能。
      },
      "aggs": {
        "top_score_member": {  // 第二层聚合：在第一层聚合结果中的每个Bucket内，在进行top_hits聚合操作。
          "top_hits": {
            "size": 2,  // 仅返回前2条记录
            "sort": [   // 排序条件按照score倒序
              {
                "score": {
                  "order": "desc"
                }
              }
            ]
          }
        }
      }
    }
  }
}

（3）Java查询示例：

TransportClient 版本示例：

// 过滤条件
BoolQueryBuilder boolQueryBuilder = QueryBuilders.boolQuery();
boolQueryBuilder.filter(QueryBuilders.termsQuery("team_id", Lists.newArrayList(1, 3, 5)));

// 聚合条件
AggregationBuilder groupAggBuilder = AggregationBuilders.terms("group_aggs")
        .field("team_id")
        .executionHint("map");  // 若可知该层聚合结果数量很小，设置成map可提升性能。
AggregationBuilder topScoreAggBuilder = AggregationBuilders.topHits("top_score_member")
        .sort("score", SortOrder.DESC)
        .size(2);
groupAggBuilder.subAggregation(topScoreAggBuilder);

// 查询结果
SearchResponse response = transportClient.prepareSearch("index_name").setTypes("type_name")
                    .setRouting("xxx")  // 若已知数据属于某一个或几个路由分区，设置路由会提升性能。
                    .setSize(0)
                    .setQuery(boolQueryBuilder)
                    .addAggregation(groupGoodsAggBuilder)
                    .get();

RestHighLevelClient 示例：

// 过滤条件
BoolQueryBuilder boolQueryBuilder = QueryBuilders.boolQuery();
boolQueryBuilder.filter(QueryBuilders.termsQuery("team_id", Lists.newArrayList(1, 3, 5)));

// 聚合条件
AggregationBuilder groupAggBuilder = AggregationBuilders.terms("group_aggs")
        .field("team_id")
        .executionHint("map");  // 若可知该层聚合结果数量很小，设置成map可提升性能。
AggregationBuilder topScoreAggBuilder = AggregationBuilders.topHits("top_score_member")
        .sort("score", SortOrder.DESC)
        .size(2);
groupAggBuilder.subAggregation(topScoreAggBuilder);

// 构造查询对象
SearchSourceBuilder searchSourceBuilder = new SearchSourceBuilder();
searchSourceBuilder.query(boolQueryBuilder);
searchSourceBuilder.size(0);
searchSourceBuilder.aggregation(groupGoodsAggBuilder);
// 观察线上接口响应情况，设置合理的超时时间。
searchSourceBuilder.timeout(new TimeValue(300));
SearchRequest request = new SearchRequest("index_name")
request.source(searchSourceBuilder);
request.setRouting("xxx")  // 若已知数据属于某一个或几个路由分区，设置路由会提升性能。

// 请求数据
SearchResponse searchResponse = restHighLevelClient.search(request, RequestOptions.DEFAULT);

SearchResponse 解析示例：

if (Objects.nonNull(response) && Objects.equals(response.status(), RestStatus.OK)) {
    Terms groupResult = response.getAggregations().get("group_aggs");
    if (Objects.nonNull(groupResult)) {
        for (Terms.Bucket groupBucket : groupResult.getBuckets()) {
            TopHits topScoreResult = groupBucket.getAggregations().get("top_score_member");
            if (Objects.nonNull(topScoreResult) && topScoreResult.getHits().getHits().length > 0) {
                SearchHit searchHit = topScoreResult.getHits().getAt(0);
                MemberDTO top1Member = JSON.parseObject(searchHit.getSourceAsString(), MemberDTO.class);
                SearchHit searchHit = topScoreResult.getHits().getAt(1);
                MemberDTO top2Member = JSON.parseObject(searchHit.getSourceAsString(), MemberDTO.class);
                // 其它逻辑
            }
        }
    }
}