elasticsearch 指标聚合（aggretationmetric）

最新推荐文章于 2024-02-21 11:17:20 发布

卤蛋x001

最新推荐文章于 2024-02-21 11:17:20 发布

阅读量280

点赞数

分类专栏： ElasticSearch 文章标签：大数据 elasticsearch

本文链接：https://blog.csdn.net/newbrid007/article/details/119641614

版权

ElasticSearch 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

{"size":"0",
    "aggs": {
        "profit": {
            "scripted_metric": {
                "init_script" : "state.transactions =[]",
                "map_script" : "state.transactions.add(doc['operatedate.keyword'].value.substring(0,4))", 
                "combine_script" : "Map profit = new HashMap(); for (t in state.transactions) { if(profit.containsKey(t)){profit.put(t,profit.get(t)+1)}  if (!profit.containsKey(t)){profit.put(t,1)}} return profit",
                "reduce_script" : "Map profit = new HashMap(); for (a in states) { profit .putAll( a) } return profit"
            }
        }
    }
}

这里解释下我个人的理解结合官方的还有其他的帖子如果理解 MapReduce 这个很像
第一步骤:init_script 是初始化一个容器这个（我这里初始化一个数组）就是像 map 端的数据流入每个节点都有一个初始化的容器可以是java Map 和List 注意要用实体类而不是直接使用Map 父类这样会造成初始化不了这里参考 java 使用 Map 就可以这里没有固定几个两个也可以我看见其他人写过
第二步骤 map_script 就是分别在各个分片上执行你想要的逻辑我这里是（生产环境的 date 类型居然变成了 Text 还有keyword 混合类型这里吐槽下恶心如果是时间类型直接直方图解决）截取前4位也就是年这里可以不用做任何逻辑只取数
第三步骤 combine_script z 类似于预聚合就是将这个节点收集起来的数据先进行逻辑处理比如我这里业务是按年分组（yyyy-MM-dd HH:mm:ss）所以逻辑不复杂就是将不同的时间放到不同 key 里面有相同的就加一
第四步骤reduce_script就是reduce 聚合这里将第三步做好的预聚合同一发送到一个节点统计处理（这里我没有写逻辑但是这里我只是将 Map 遍历后重新放入所以可能底层做加和运算了这样就有数据输出）

{
  "took" : 1,
  "timed_out" : false,
  "_shards" : {
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : {
      "value" : 11,
      "relation" : "eq"
    },
    "max_score" : null,
    "hits" : [ ]
  },
  "aggregations" : {
    "profit" : {
      "value" : {
        "2021" : 3,
        "2020" : 7,
        "2019" : 1
      }
    }
  }
}

ps : 小小吐槽下时间类型用text 不知道怎么做的范围查询难为以前的开发人员了不过好在马上要改了不过这个着实让我头疼了
还有一个方式就是聚合脚本的模式不知道上下两种哪个性能要好一些下面这个如果节点很多会抛出 75/5m 哪个异常需要设置下范围提升到 100/1m 接触不到生产环境闭门开发的一个小白 如果帮到了你不要吝啬你的赞 ~~~~

{
  "query": {
    "match_all": {}
  },"aggs": {
    "NAME": {
      "terms":{
       "script": {
              "source": "def domain = doc['operatedate.keyword'].value;def beginIndex1 =domain.substring(0,4);return beginIndex1"
            }
      }
    }
  }
}