ElasticSearch—聚集检索

最新推荐文章于 2023-02-09 00:14:33 发布

大树1993

最新推荐文章于 2023-02-09 00:14:33 发布

阅读量125

点赞数

分类专栏：搜索引擎

本文链接：https://blog.csdn.net/qq_44786879/article/details/107558280

版权

9 篇文章 0 订阅

订阅专栏

高级统计
- 对查询返回的匹配文档集合进行聚合计算，是绝对准确的
- stats/extended_stats: 对数值型字段同时获取sum,avg,max,min，value_count等聚集结果
近似统计
包含百分位好人基数两种近似统计方式，牺牲一定程度的准确性换取性能提升
- 百分位(percentiles)：获取小于测量值的累计百分比，50%的百分位最不准确，越接近0或100越准确
- 基数(cardinality): 获取字段中唯一值的数量

词条聚集(trems aggregation)/显著词条聚集: 根据字段值创建多个桶
- 词条聚集一般统计的是词条，因此通常需要在非分析型字段(不分词)上执行这种聚集
- 默认情况下聚集的词条顺序是由词频降序排序的，也可以使用order属性指定排序规则
- 默认的terms聚集返回倒序排序的前10个(可通过size配置)词条，但这未必是准确的
范围聚集(range aggregation): 根据范围创建不同的桶
直方图聚集(histogram aggregation): 根据步长构建多个桶
嵌套聚集(nested aggregation): 允许用户针对文档的关系执行聚集
地理聚集(geo distance aggregation): 根据地理位置创建桶
嵌套聚集:多桶聚集通常是开始聚集的起始点，子聚集作用在每个桶上
分组top: 在多桶上使用top_hits嵌套聚集返回分组信息

默认情况下ElasticSearch在查询结果上运行聚集，如果要改变这种默认行为使用单桶聚集

关注

专栏目录