Java操作Elasticsearch6实现group by分组查询

引言

通过上篇博客的总结,我们知道了在Elasticsearch6中count、distinct和count(distinct)方法的使用。本篇博客继续聚合查询的学习,也就是对应mysql中的group by的使用。

公共实体

对于下面要介绍的查询,返回结果为统一实体,代码如下:
/**
 * 单个字段分组返回结果
 *
 * @author : huzhiting
 * @date : 2020-11-18 15:02
 */
@Data
public class AggregationForOneDTO implements Serializable {
    /**
     * 分组字段对应的值
     */
    private String key;
    /**
     * 分组统计字段对应的总数
     */
    private Integer count;
}

1. group by分组统计

对应mysql中的sql如下:
select field1,count(field2) from table_name group by field1;
针对上面的sql,对应的elasticsearch代码如下:
/**
 * 指定索引文档数据中按某个字段分组后对应的文档总数
 */
@Test
public void testCountGroupBy() {
    SearchRequest searchRequest = new SearchRequest();
    searchRequest.indices("indexName").types("indexType");
    TermsAggregationBuilder aggregation = AggregationBuilders
            //别名
    		.terms("uid")  
            //聚合字段名
            .field("uid.keyword")
            //降序
            .order(BucketOrder.count(false))
            //聚合结果数据量,默认只返回前十条
            .size(100);
    SearchSourceBuilder searchSourceBuilder = new SearchSourceBuilder();
    searchSourceBuilder.aggregation(aggregation);
    //执行查询
    searchRequest.source(searchSourceBuilder);
    List<AggregationForOneDTO> result = new ArrayList<>();
    SearchResponse response;
    try {
        response = restHighLevelClient.search(searchRequest, RequestOptions.DEFAULT);
        log.info("response is {}", response);
        Terms byAgeAggregation = response.getAggregations().get("uid");
        for (Terms.Bucket buck : byAgeAggregation.getBuckets()) {
            AggregationForOneDTO aggregationForOne = new AggregationForOneDTO();
            aggregationForOne.setCount((int) buck.getDocCount());
            aggregationForOne.setKey(buck.getKeyAsString());
            result.add(aggregationForOne);
        }
    } catch (IOException e) {
        log.error("[EsClientConfig.groupByField][error][fail to query]", e);
    }
    log.info("result is {}", JSON.toJSONString(result));
}
为了看到更直观的结果,附上一张结果截图,其中对应的key就是分组的字段值,count就是通过该字段查询到的文档总数:

在这里插入图片描述

2. group by分组统计去重

对应mysql中的sql如下:
select field1,count(distinct (field2)) from table_name group by field1;
对应的Elasticsearch查询代码如下:
@Test
public void testCountDistinctGroupBy() {
    SearchRequest searchRequest = new SearchRequest();
    searchRequest.indices("indexName").types("indexType");
    //指定去重字段,cardinality指定别名,field指定字段名
    CardinalityAggregationBuilder aggregationBuilder = 
AggregationBuilders.cardinality("alias").field("field_distinct");
    //指定分组字段,terms指定别名,field指定字段名
    TermsAggregationBuilder aggregation = AggregationBuilders.terms("alias")  
            //聚合字段名
            .field("field_group")
            .subAggregation(aggregationBuilder)
            .size(100)
            //按去重字段数量降序
            .order(BucketOrder.aggregation("field_distinct", false));
    SearchSourceBuilder searchSourceBuilder = new SearchSourceBuilder();
    searchSourceBuilder.aggregation(aggregation);
    //执行查询
    searchRequest.source(searchSourceBuilder);
    List<AggregationForOneDTO> result = new ArrayList<>();
    SearchResponse response;
    try {
        response = restHighLevelClient.search(searchRequest, RequestOptions.DEFAULT);
        Terms byAgeAggregation = response.getAggregations().get("field_group");
        for (Terms.Bucket buck : byAgeAggregation.getBuckets()) {
            Aggregations aggregations1 = buck.getAggregations();
            Aggregation subjectCount = aggregations1.get("field_distinct");
            JSONObject jsonObject = JSON.parseObject(JSON.toJSONString(subjectCount));
            String cardinalityValue = jsonObject.getString("value");
            AggregationForOneDTO aggregationForOne = new AggregationForOneDTO();
            aggregationForOne.setCount(Integer.parseInt(cardinalityValue));
            aggregationForOne.setKey(buck.getKeyAsString());
            result.add(aggregationForOne);
        }
    } catch (IOException e) {
        log.error("[EsClientConfig.groupByField][error][fail to query]", e);
    }
    log.info("result is {}", JSON.toJSONString(result));
}
结果如下,和第一个查询一样,只是count是按照某个字段去重后的结果统计:

在这里插入图片描述

总结

通过这两篇博客的相关总结,对elasticsearch6中的聚合查询有了简单的了解,对于一些简单的查询统计是可以应对了,但在这过程中发现了很多东西都还没有用到,后面有机会还需要多实践。
  • 2
    点赞
  • 36
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
您好!对于Java中的Elasticsearch(ES)库,您可以使用聚合(Aggregation)来实现类似SQL中的GROUP BY和COUNT操作。以下是一个示例代码: ```java import org.elasticsearch.action.search.SearchResponse; import org.elasticsearch.client.Client; import org.elasticsearch.index.query.QueryBuilders; import org.elasticsearch.search.aggregations.AggregationBuilders; import org.elasticsearch.search.aggregations.bucket.terms.StringTerms; import org.elasticsearch.search.aggregations.metrics.sum.Sum; import org.elasticsearch.search.sort.SortBuilders; import org.elasticsearch.search.sort.SortOrder; public class EsGroupByCountExample { public static void main(String[] args) { // 创建Elasticsearch客户端 Client client = createClient(); // 构建聚合查询 SearchResponse response = client.prepareSearch("your_index") .setQuery(QueryBuilders.matchAllQuery()) .addAggregation( AggregationBuilders.terms("group_by_field") .field("your_field") .order(SortOrder.DESC) .size(10) .subAggregation(AggregationBuilders.sum("count") .field("your_count_field")) ) .execute() .actionGet(); // 解析聚合结果 StringTerms terms = response.getAggregations().get("group_by_field"); for (StringTerms.Bucket bucket : terms.getBuckets()) { String key = bucket.getKeyAsString(); Sum sum = bucket.getAggregations().get("count"); double count = sum.getValue(); System.out.println(key + ": " + count); } // 关闭客户端连接 client.close(); } // 创建Elasticsearch客户端 private static Client createClient() { // 这里省略了创建Elasticsearch客户端的代码 // 您可以根据自己的需求选择合适的方式创建客户端 return null; } } ``` 请注意,上述代码中的"your_index"、"your_field"和"your_count_field"需要替换为您实际使用的索引名称、字段名称和计数字段名称。 这段代码将执行一个聚合查询,按指定字段分组,并计算每个分组的计数。然后,通过遍历聚合结果的桶(buckets),获取每个分组的键(key)和对应的计数值(count)。 希望这可以帮助到您!如果有任何进一步的问题,请随时提问。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值