ElasticSearch 学习笔记:聚合(Aggregation) - Top Hits

本文目录

1 功能简介

2 使用示例

(1)场景示例:

(2)ES查询示例:

(3)Java查询示例:

3 相关文章

官方文档

1 功能简介

聚合后,每一个聚合Bucket里面仅返回指定顺序的前N条数据。

2 使用示例

(1)场景示例:

ES库中存储着成员数据,每个成员有自己的编号ID、所属的团队ID和个人得分等数据:id, team_id, score, age...

给定一组团队ID列表:team_id IN (1, 5, 7)

查询每个团队中得分最高的2个人的编号ID。

(2)ES查询示例:

GET .../_search?routing=xxx  // 若已知数据属于某一个或几个路由分区,设置路由会提升性能。
{
  "size": 0,  // 仅过滤数据,不返回命中数据。
  "query": {
    "bool": {
      "filter": [  // 过滤条件,在聚合前先进行数据筛选。
        {
          "terms": {
            "team_id": [
              1,
              5,
              7
            ]
          }
        }
      ]
    }
  },
  "aggs": {
    "group_aggs": {  // 第一层聚合:先按照team_id将数据聚合成多个Bucket。
      "terms": {
        "field": "team_id",
        "execution_hint": "map"  // 若可知该层聚合结果数量很小,设置成map可提升性能。
      },
      "aggs": {
        "top_score_member": {  // 第二层聚合:在第一层聚合结果中的每个Bucket内,在进行top_hits聚合操作。
          "top_hits": {
            "size": 2,  // 仅返回前2条记录
            "sort": [   // 排序条件按照score倒序
              {
                "score": {
                  "order": "desc"
                }
              }
            ]
          }
        }
      }
    }
  }
}

(3)Java查询示例:

TransportClient 版本示例:

// 过滤条件
BoolQueryBuilder boolQueryBuilder = QueryBuilders.boolQuery();
boolQueryBuilder.filter(QueryBuilders.termsQuery("team_id", Lists.newArrayList(1, 3, 5)));

// 聚合条件
AggregationBuilder groupAggBuilder = AggregationBuilders.terms("group_aggs")
        .field("team_id")
        .executionHint("map");  // 若可知该层聚合结果数量很小,设置成map可提升性能。
AggregationBuilder topScoreAggBuilder = AggregationBuilders.topHits("top_score_member")
        .sort("score", SortOrder.DESC)
        .size(2);
groupAggBuilder.subAggregation(topScoreAggBuilder);

// 查询结果
SearchResponse response = transportClient.prepareSearch("index_name").setTypes("type_name")
                    .setRouting("xxx")  // 若已知数据属于某一个或几个路由分区,设置路由会提升性能。
                    .setSize(0)
                    .setQuery(boolQueryBuilder)
                    .addAggregation(groupGoodsAggBuilder)
                    .get();

RestHighLevelClient 示例:

// 过滤条件
BoolQueryBuilder boolQueryBuilder = QueryBuilders.boolQuery();
boolQueryBuilder.filter(QueryBuilders.termsQuery("team_id", Lists.newArrayList(1, 3, 5)));

// 聚合条件
AggregationBuilder groupAggBuilder = AggregationBuilders.terms("group_aggs")
        .field("team_id")
        .executionHint("map");  // 若可知该层聚合结果数量很小,设置成map可提升性能。
AggregationBuilder topScoreAggBuilder = AggregationBuilders.topHits("top_score_member")
        .sort("score", SortOrder.DESC)
        .size(2);
groupAggBuilder.subAggregation(topScoreAggBuilder);

// 构造查询对象
SearchSourceBuilder searchSourceBuilder = new SearchSourceBuilder();
searchSourceBuilder.query(boolQueryBuilder);
searchSourceBuilder.size(0);
searchSourceBuilder.aggregation(groupGoodsAggBuilder);
// 观察线上接口响应情况,设置合理的超时时间。
searchSourceBuilder.timeout(new TimeValue(300));
SearchRequest request = new SearchRequest("index_name")
request.source(searchSourceBuilder);
request.setRouting("xxx")  // 若已知数据属于某一个或几个路由分区,设置路由会提升性能。

// 请求数据
SearchResponse searchResponse = restHighLevelClient.search(request, RequestOptions.DEFAULT);

SearchResponse 解析示例:

if (Objects.nonNull(response) && Objects.equals(response.status(), RestStatus.OK)) {
    Terms groupResult = response.getAggregations().get("group_aggs");
    if (Objects.nonNull(groupResult)) {
        for (Terms.Bucket groupBucket : groupResult.getBuckets()) {
            TopHits topScoreResult = groupBucket.getAggregations().get("top_score_member");
            if (Objects.nonNull(topScoreResult) && topScoreResult.getHits().getHits().length > 0) {
                SearchHit searchHit = topScoreResult.getHits().getAt(0);
                MemberDTO top1Member = JSON.parseObject(searchHit.getSourceAsString(), MemberDTO.class);
                SearchHit searchHit = topScoreResult.getHits().getAt(1);
                MemberDTO top2Member = JSON.parseObject(searchHit.getSourceAsString(), MemberDTO.class);
                // 其它逻辑
            }
        }
    }
}

3 相关文章

《ElasticSearch 学习笔记:常用内容》

《ElasticSearch 学习笔记:Multi Search》

《ElasticSearch 学习笔记:Mapping》

《ElasticSearch 学习笔记:Reindex》

官方文档

ElasticSearch Top Hits Aggregation

  • 2
    点赞
  • 26
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
要获取聚合结果,你可以使用以下步骤: 1. 通过`search.getAggregations()`方法获取聚合结果对象`Aggregations`。 2. 使用`asList()`方法将聚合结果转换为一个`List<Aggregation>`对象,其中每个元素代表一个聚合。 3. 根据你之前设置的聚合名字,使用`get()`方法获取特定的聚合对象。 根据你的代码示例,假设你的聚合名字是"BrandAGG",你可以按照以下方式获取该聚合对象: ```java Aggregations aggregations = search.getAggregations(); List<Aggregation> list = aggregations.asList(); for (Aggregation aggregation : list) { if (aggregation.getName().equals("BrandAGG")) { // 找到了指定的聚合 Terms termsAggregation = (Terms) aggregation; // 获取聚合桶 List<? extends Terms.Bucket> buckets = termsAggregation.getBuckets(); // 遍历聚合桶 for (Terms.Bucket bucket : buckets) { String brand = bucket.getKeyAsString(); long docCount = bucket.getDocCount(); // 处理每个聚合桶的结果 System.out.println("品牌:" + brand + ",文档数量:" + docCount); } } } ``` 上述代码将遍历所有的聚合结果,找到名为"BrandAGG"的聚合,并获取该聚合的桶列表。然后,你可以进一步处理每个聚合桶的结果,例如获取品牌名和对应的文档数量。 请注意,根据你的需求,你可能需要对聚合结果进行类型转换。在上述示例中,假设你的聚合类型是`Terms`聚合,因此我们将其转换为`Terms`对象。如果你的聚合类型是其他类型(如`DateHistogram`、`Range`等),则需要进行相应的类型转换。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值