如果写过Elasticsearch的聚合操作DSL,都知道它非常的繁琐,很简单的业务就导致异常复杂的json。因为它的聚合操作是嵌套的,一个聚合的输出可以是另一个聚合的输入,并且聚合还支持pipeline,能引用父亲或者兄弟节点的聚合,所以导致其结构非常难以理解。本文将根据一个实际的例子来逐步的构建一个Elasticsearch的聚合DSL语句,来方便大家理解ES的聚合操作。
假设在index test-order中存储了用户的订单信息,name表示用户姓名,price表示订单价格。
GET test-order/_search?filter_path=hits.hits._source
数据如下
现在有如下需求,首先规定消费总金额在100以上的用户为VIP,然后要计算系统中VIP的数量。这要是在传统的关系数据库中,是非常简单的,首先group by name,计算sum(price),然后用having语句过滤VIP,最后再count临时表,得到 VIP的数量。SQL语句如下
在ES中,我们也需要按照同样的顺序构建DSL。
group
首先按照name来分组,用Terms Aggregation来充当group。
sum
将name分组后的结果作为输入,对price字段进行sum。可以看到下面是将一个sum聚合嵌套在了term聚合中。