Elasticsearch过滤与聚合的先后顺序java实现

本文详细介绍了Elasticsearch中的聚合概念,重点讨论了term、range和date range三种桶聚合的使用,并提供了Java API的实现示例。同时,解释了先聚合再过滤的需求场景,如美团应用中的菜品分类展示,通过postfilter解决过滤不影响聚合结果的问题。最后,文章提及了如何处理多次过滤和聚合的后续学习方向。
摘要由CSDN通过智能技术生成

一、Elasticsearch的聚合

ES的聚合相当于关系型数据库里面的group by,例如查找在性别字段男女人数的多少并且按照人数的多少进行排序,在使用mysql的时候,可以使用如下的句子

select sex,count(*) from table_name group by sex order by count(*)
在ES里面想要实现这种的语句,就叫做聚合,比如这种的聚合使用DSL语句的话如下所示:

GET /index/type/_search
{
    "size" : 0,
    "aggs" : { 
        "agg_sex" : { 
            "terms" : { 
              "field" : "sex"
            }
        }
    }
}
这样就可以实现最以上例子中的group by的功能,当然这只是最简单的聚合的使用,在ES里面的聚合有多重多样的,比如说有度量聚合,可以用来计算某一个字段的平均值最大值等,在此给出一个简单的度量聚合的例子

GET /index/type/_search
{
   "size" : 0,
   "aggs": {
      "agg_sex": {
         "terms": {
            "field": "sex"
         },
         "agg_age": { 
            "avg_age": { 
               "avg": {
                  "field": "age" 
               }
            }
         }
      }
   }
}
这个DSL语句就是将先按照性别进行聚合,并且对不同的性别给出一个平均的年龄,使用之后ES的给出结果如下所示:

{
...
   "aggregations": {
      "agg_sex": {
         "buckets": [
            {
               "key": "male",
               "doc_count": 4,
               "avg_age": { 
                  "value": 25
               }
            },
            {
               "key": "female",
               "doc_count": 2,
               "avg_age": {
                  "value": 23
               }
            }
         ]
      }
   }
...
}

在度量聚合里面有min,max,sum,avg聚合等,还有stats,extern_stat

  • 5
    点赞
  • 49
    收藏
    觉得还不错? 一键收藏
  • 8
    评论
Java 中使用 Elasticsearch 进行聚合并去重,您可以借助 ElasticsearchJava 客户端库进行实现。以下是一个示例代码片段,演示如何使用 Java 客户端进行聚合去重操作: ```java import org.elasticsearch.action.search.SearchRequest; import org.elasticsearch.action.search.SearchResponse; import org.elasticsearch.client.RequestOptions; import org.elasticsearch.client.RestClient; import org.elasticsearch.client.RestHighLevelClient; import org.elasticsearch.index.query.QueryBuilders; import org.elasticsearch.search.aggregations.AggregationBuilders; import org.elasticsearch.search.aggregations.bucket.terms.Terms; import org.elasticsearch.search.builder.SearchSourceBuilder; import java.io.IOException; public class ESQueryAggregation { public static void main(String[] args) { // 创建 Elasticsearch 客户端 RestHighLevelClient client = new RestHighLevelClient( RestClient.builder(new HttpHost("localhost", 9200, "http"))); // 创建聚合查询请求 SearchRequest searchRequest = new SearchRequest("your_index"); SearchSourceBuilder sourceBuilder = new SearchSourceBuilder(); // 设置查询条件(可根据需求自行调整) sourceBuilder.query(QueryBuilders.matchAllQuery()); // 添加聚合操作(使用 Terms Aggregation 进行去重) sourceBuilder.aggregation(AggregationBuilders.terms("unique_values").field("your_field").size(10)); searchRequest.source(sourceBuilder); try { // 执行查询 SearchResponse searchResponse = client.search(searchRequest, RequestOptions.DEFAULT); // 处理聚合结果 Terms uniqueValues = searchResponse.getAggregations().get("unique_values"); for (Terms.Bucket bucket : uniqueValues.getBuckets()) { String uniqueValue = bucket.getKeyAsString(); System.out.println("Unique Value: " + uniqueValue); } // 关闭 Elasticsearch 客户端 client.close(); } catch (IOException e) { e.printStackTrace(); } } } ``` 请注意,上述代码中的 "your_index" 和 "your_field" 需要替换为您实际的索引名称和字段名称。另外,您需要将 ElasticsearchJava 客户端库添加到您的项目依赖中。 这是一个简单的示例,您可以根据自己的需求进行调整和扩展。希望对您有所帮助!如果您有任何其他问题,请随时提问。
评论 8
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值