使用框架:spring-data-elasticsearch:3.0.8.RELEASE
elasticsearch版本:5.1.1 ~ 5.5.0
spring-data-elasticsearch
随着版本不同方法名会不一样,具体需要看源码
1、cardinality去重
对于4w以上数据的去重无法达到100%准确度
// precisionThreshold 设置精确数量,越高内存消耗越大
AggregationBuilders.cardinality("distinct").field("hid").precisionThreshold(40000);
2、terms分组统计
结果是带分页的,默认只显示10条分组数据
// 通过size设置数量
AggregationBuilders.terms("groupBy").field("date").size(Integer.MAX_VALUE);
3、spring-data-elasticsearch聚合结果
spring返回的是Page对象,需要强制转型AggregatedPageImpl
才能使用,聚合顶层接口是Aggregation
,根据聚合类型不一样,具体实现不一样。如果要获取聚合数值,需要强制转型。
目前我使用到的聚合类型如下:ipRange
range
terms
cardinality
ipRange
range
terms
的聚合结果都有一个唯一的上层接口