elasticsearch dsl 查询 聚合 去重

报表需求,利用es进行存储

  1. 根据日期,查询每天某个渠道的访问量
GET service-xxx-logs*/_search
{
    "size": 0,
    "aggs": {
       "return_data": {
          "date_histogram": {
            "field": "@timestamp",
            "interval": "day"
          }
        }
     },
    "query": { 
      "bool": { 
        "must": [
          { "match": { "xxx": {"query": "xxxxxxxx"}}},
          { "match": { "channel": {"query": "00"}}}
        ],
        "filter": [ 
          { "range": {
              "@timestamp": {
               "gte": "now-10d", 
               "lt":  "now"
               }
            }
          }
        ]
      }
    }
}

针对如上查询语句,做个分解
聚合相关:aggs、date_histogram、field、interval、format

    "size": 0,
    "aggs": { //聚合
       "return_data": { //返回的字段值
          "date_histogram": { //es提供的时间处理函数
            "field": "@timestamp", //需要聚合的字段
            "interval": "day", //按天
            "format": "yyyy-MM-dd" //格式化
          }
        }
     }

查询条件

    "query": { 
      "bool": { 
        "must": [
          { "match": { "xxx": {"query": "xxxxxxxx"}}},//匹配条件 xxx为字段,xxxxx为对应的值
          { "match": { "channel": {"query": "00"}}}//channel为索引中的字段,00为值
        ],
        "filter": [ 
          { "range": {
              "@timestamp": {//根据日期进行过滤
               "gte": "now-10d", //10d表示10天之前
               "lt":  "now"  //当前时间
               }
            }
          }
        ]
      }
    }

查询结果:
在这里插入图片描述根据日期进行聚合,查询某个渠道的访问量

  1. 对访问的人员进行去重
    函数:cardinality、xxx.keyword
"size": 0,
    "aggs": {
       "return_data": {
          "date_histogram": {
            "field": "@timestamp",
            "interval": "day",
            "format": "yyyy-MM-dd"
          },"aggs":{
            "return_data": {
              "cardinality": {  //es提供的去重函数
                "field": "user_id.keyword" //对访问的人员进行去重
              }
           }
         }
        }
     },
    "query": { 
      "bool": { 
        "must": [
          { "match": { "xxx": {"query": "xxxxx"}}},
          { "match": { "channel": {"query": "00"}}}
        ],
        "filter": [ 
          { "range": {
              "@timestamp": {
               "gte": "now-10d", 
               "lt":  "now"
               }
            }
          }
        ]
      }
    }
在 Java 中使用 Elasticsearch 进行聚合去重,您可以借助 Elasticsearch 的 Java 客户端库进行实现。以下是一个示例代码片段,演示如何使用 Java 客户端进行聚合去重操作: ```java import org.elasticsearch.action.search.SearchRequest; import org.elasticsearch.action.search.SearchResponse; import org.elasticsearch.client.RequestOptions; import org.elasticsearch.client.RestClient; import org.elasticsearch.client.RestHighLevelClient; import org.elasticsearch.index.query.QueryBuilders; import org.elasticsearch.search.aggregations.AggregationBuilders; import org.elasticsearch.search.aggregations.bucket.terms.Terms; import org.elasticsearch.search.builder.SearchSourceBuilder; import java.io.IOException; public class ESQueryAggregation { public static void main(String[] args) { // 创建 Elasticsearch 客户端 RestHighLevelClient client = new RestHighLevelClient( RestClient.builder(new HttpHost("localhost", 9200, "http"))); // 创建聚合查询请求 SearchRequest searchRequest = new SearchRequest("your_index"); SearchSourceBuilder sourceBuilder = new SearchSourceBuilder(); // 设置查询条件(可根据需求自行调整) sourceBuilder.query(QueryBuilders.matchAllQuery()); // 添加聚合操作(使用 Terms Aggregation 进行去重) sourceBuilder.aggregation(AggregationBuilders.terms("unique_values").field("your_field").size(10)); searchRequest.source(sourceBuilder); try { // 执行查询 SearchResponse searchResponse = client.search(searchRequest, RequestOptions.DEFAULT); // 处理聚合结果 Terms uniqueValues = searchResponse.getAggregations().get("unique_values"); for (Terms.Bucket bucket : uniqueValues.getBuckets()) { String uniqueValue = bucket.getKeyAsString(); System.out.println("Unique Value: " + uniqueValue); } // 关闭 Elasticsearch 客户端 client.close(); } catch (IOException e) { e.printStackTrace(); } } } ``` 请注意,上述代码中的 "your_index" 和 "your_field" 需要替换为您实际的索引名称和字段名称。另外,您需要将 Elasticsearch 的 Java 客户端库添加到您的项目依赖中。 这是一个简单的示例,您可以根据自己的需求进行调整和扩展。希望对您有所帮助!如果您有任何其他问题,请随时提问。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值