java使用TermsAggregationBuilder可以实现ES多字段的统计查询

前言

现在需要使用java从ES库中查询出某些字段以及其数量,以及所属其他的字段。如下图

媒体类型媒体名称文章数量
新闻证券之星-公司公告6
微信概率扑克噢2
新闻同花顺-独家公告解读 正文2
平媒市场星报2

1.BoolQueryBuilder

根据publishTime设置查询范围。

BoolQueryBuilder boolQueryBuilder = QueryBuilders.boolQuery();
boolQueryBuilder.must(QueryBuilders.rangeQuery("publishTime")
                .gte(beginTime)
                .lte(endTime)
                .format("yyyy-MM-dd HH:mm:ss")
                .timeZone("+08:00"));

2.设置分组

//使用两次分组分组查询,以媒体名称/webName为主 默认十条数据
TermsAggregationBuilder termsSourceTypeSourcePlaceGroup = AggregationBuilders.terms("sourceTypeGroup")
        .field("sourceType");//根据媒体名称分组
TermsAggregationBuilder sourcePlaceGroup = AggregationBuilders.terms("webNameGroup")//根据媒体类型分组
        .field("webName").subAggregation(termsSourceTypeSourcePlaceGroup);

3.分组查询

//分组查询
SearchResponse searchResponse = elasticsearchTemplate.getClient().prepareSearch(ApiState.INDEX_NAME)
        .setQuery(boolQueryBuilder)
        .addAggregation(sourcePlaceGroup)
        .get();
Aggregations aggregations = searchResponse.getAggregations();

4.获取查询结果

//获取主分组信息
Terms sourceType = aggregations.get("webNameGroup");
//遍历主分组获取媒体名称信息以及文章个数
for (Terms.Bucket bucket : sourceType.getBuckets()) {
    Map<String, Object> result = new HashMap<>();
    result.put("webName", bucket.getKeyAsString());
    result.put("value",bucket.getDocCount());

    //获取域名分组信息 取第一个元素
    Terms urlSourcetype = bucket.getAggregations().get("urlGroup");
    if (urlSourcetype.getBuckets().size()>0){
        result.put("url",urlSourcetype.getBuckets().get(0).getKeyAsString());
    }
    //获取媒体来源分组信息 去第一个元素
    Terms sourceTypeSourcetype = bucket.getAggregations().get("sourceTypeGroup");
    if(sourceTypeSourcetype.getBuckets().size()>0){
        result.put("sourceType",MediaStatus.getDescription(sourceTypeSourcetype.getBuckets().get(0).getKeyAsString()));
    }
    //加入到集合
    resultList.add(result);
}
  • 0
    点赞
  • 31
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
可以使用 Elasticsearch Java API 中的 Aggregation API 来实现聚合查询某一字段分组的数量。具体步骤如下: 1. 创建一个 SearchRequest 对象,并设置索引及查询条件: ``` SearchRequest searchRequest = new SearchRequest("index_name"); SearchSourceBuilder searchSourceBuilder = new SearchSourceBuilder(); searchSourceBuilder.query(QueryBuilders.matchAllQuery()); ``` 2. 创建一个 TermsAggregationBuilder 对象,并设置聚合字段: ``` TermsAggregationBuilder aggregationBuilder = AggregationBuilders.terms("group_by_field") .field("field_name") .size(10); // 设置返回结果的数量 ``` 3. 将聚合对象添加到 SearchSourceBuilder 中: ``` searchSourceBuilder.aggregation(aggregationBuilder); ``` 4. 执行查询,并处理返回结果: ``` searchRequest.source(searchSourceBuilder); SearchResponse response = client.search(searchRequest, RequestOptions.DEFAULT); Terms termsAggregation = response.getAggregations().get("group_by_field"); for (Terms.Bucket bucket : termsAggregation.getBuckets()) { String key = bucket.getKeyAsString(); long count = bucket.getDocCount(); System.out.println("Key: " + key + ", Count: " + count); } ``` 以上代码中,`client` 是一个 Elasticsearch 客户端对象,通过 `response.getAggregations().get("group_by_field")` 获取到聚合结果对象,然后遍历 Buckets 获取每个分组的 key 和 count。 需要注意的是,这里使用的是 TermsAggregationBuilder 对象来实现分组聚合查询,如果需要根据其他条件进行聚合查询,则需要使用其他类型的 AggregationBuilder 对象。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值