java ElasticSearch es 聚合排序等

序言:

        近来一直在javaAPI对ES数据进行统计分析, 中间也遇到不少问题, 本篇文章只针对聚合过程中的排序方法进行总结

例如:select  avg(age) as avg_age from table group by gender;

 

聚合的两种排序方式

       1. 按组内字段排序: 分组后按组内数据某个字段进行排序

       2. 按聚合后指标排序: 分组聚合后按照聚合后的某个新指标字段进行排序

 

案例:

1. 按组内字段排序

AggregationBuilder aggregation =
    AggregationBuilders
        .terms("agg").field("gender")
        .subAggregation(
            AggregationBuilders.topHits("top")
                .explain(true)
                .size(1)
                .from(10)
                .sort("sortFiled", SortOrder.ASC)
        );
输出

import org.elasticsearch.search.aggregations.bucket.terms.Terms;
import org.elasticsearch.search.aggregations.metrics.tophits.TopHits;
 
// sr is here your SearchResponse object
Terms agg = sr.getAggregations().get("agg");
 
// For each entry
for (Terms.Bucket entry : agg.getBuckets()) {
    String key = entry.getKey();                    // bucket key
    long docCount = entry.getDocCount();            // Doc count
    logger.info("key [{}], doc_count [{}]", key, docCount);
 
    // We ask for top_hits for each bucket
    TopHits topHits = entry.getAggregations().get("top");
    for (SearchHit hit : topHits.getHits().getHits()) {
        logger.info(" -> id [{}], _source [{}]", hit.getId(), hit.getSourceAsString());
    }
}
2. 按聚合后指标排序

 

 import org.elasticsearch.search.aggregations.BucketOrder;
 doc_count以递增的方式

 AggregationBuilders
    .terms("genders")
    .field("gender")
    .order(BucketOrder.count(true))
按升序方式按字母顺序按顺序排序 

 AggregationBuilders
    .terms("genders")
    .field("gender")
    .order(BucketOrder.key(true))
按聚合名称标识对桶进行排序 

 AggregationBuilders
    .terms("genders")
    .field("gender")
    .order(BucketOrder.aggregation("avg_height", false))
    .subAggregation(
        AggregationBuilders.avg("avg_height").field("height")
    )
 按多个聚合指标对桶进行排序

 AggregationBuilders
    .terms("genders")
    .field("gender")
    .order(BucketOrder.compound( // in order of priority:
        BucketOrder.aggregation("avg_height", false), // sort by sub-aggregation first
        BucketOrder.count(true))) // then bucket count as a tie-breaker
    .subAggregation(
        AggregationBuilders.avg("avg_height").field("height")
    )
参考:https://www.elastic.co/guide/en/elasticsearch/client/java-api/current/_bucket_aggregations.html 
--------------------- 
作者:tiansheng1225 
来源:CSDN 
原文:https://blog.csdn.net/tiansheng1225/article/details/82661577 
版权声明:本文为博主原创文章,转载请附上博文链接!

  • 3
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Elasticsearch 是一个开源的分布式搜索引擎,提供了非常强大的聚合查询功能。聚合查询是指对数据进行分组、排序、统计等操作,以便更好地理解和分析数据。 在 Java 中使用 Elasticsearch 聚合查询,可以通过 ElasticsearchJava API 来实现。以下是一个简单的示例代码: ```java SearchResponse response = client.prepareSearch("index_name") .addAggregation(AggregationBuilders.terms("group_by_field").field("field_name")) .execute().actionGet(); Terms terms = response.getAggregations().get("group_by_field"); for (Terms.Bucket entry : terms.getBuckets()) { String fieldValue = (String) entry.getKey(); long count = entry.getDocCount(); System.out.println(fieldValue + ":" + count); } ``` 上述代码中,首先使用 `client.prepareSearch()` 方法创建一个查询对象,然后使用 `AggregationBuilders.terms()` 方法创建一个分组聚合查询。其中,`group_by_field` 是聚合名称,`field_name` 是需要分组的字段名。接着,使用 `execute()` 方法执行查询操作,并将结果存储在 `response` 对象中。最后,通过 `response.getAggregations()` 方法获取聚合结果,并遍历结果进行处理。 除了分组聚合查询,Elasticsearch 还提供了很多其他类型的聚合查询,例如平均值、最大值、最小值、汇总等。可以通过 `AggregationBuilders` 类中的方法来创建不同类型的聚合查询。 需要注意的是,在进行聚合查询时,应该尽量避免使用过多的聚合操作,否则可能会对性能造成影响。此外,由于 Elasticsearch 是一个分布式搜索引擎,因此在进行聚合查询时,应该尽量减少数据的传输量,以提高查询效率。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值