elasticsearch分组排序取top N

背景

比如有一张通话记录表,里面有用户UID,电话号number,用户所属国家country,通话时长talktime几个主要字段。现在的需求是要获取平均通话时长最长的top 20个国家。

实现

先过滤掉一些不需要的数据,然后根据country分桶,在桶内求平均通话时长。最后根据每个桶的平均通话时长取top 20的桶。

GET talk-information-2020.04.21/_search
{
  "query": {
    "bool": {
      "must":[
      {
        "exists":{
              "field": "country" //必须存在国家字段
            }
		}
    ],
	  "filter": {
	    "range": {
		  "talktime": {
		    "gte": 1000  //通话时长大于等于1秒
		  }
	    }
	  }
    }
  }, 
  "size": 0,
  "aggs": {
    "country": {
      "terms": {
        "field": "country.keyword",  //根据国家分桶
        "size": 100000  //分桶数量(根据实际数据确定)
      },
      "aggs": {
        "avg_time": {
          "avg": {
            "field": "talktime"  //桶内求平均通话时长
          }
        },
      "country_bucket_sort": {
          "bucket_sort": {
              "sort": [
                {"avg_time": {"order": "desc"}}  //根据平均通话时长对桶排序
              ],
              "size": 10  //取前10个桶
          }
        }
      }
    }
  }
}
  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值