初使用elasticsearch踩过的坑

本文介绍了在使用Elasticsearch 5.1.1到5.5.0版本时遇到的问题,包括cardinality去重在大数据量下可能不准确,terms分组统计默认仅显示10条分组数据,以及在spring-data-elasticsearch中聚合结果需要特殊处理才能获取。重点讨论了聚合操作在实际应用中的挑战和解决方案。
摘要由CSDN通过智能技术生成

使用框架:spring-data-elasticsearch:3.0.8.RELEASE
elasticsearch版本:5.1.1 ~ 5.5.0
spring-data-elasticsearch随着版本不同方法名会不一样,具体需要看源码

1、cardinality去重
对于4w以上数据的去重无法达到100%准确度

// precisionThreshold 设置精确数量,越高内存消耗越大
AggregationBuilders.cardinality("distinct").field("hid").precisionThreshold(40000);

2、terms分组统计
结果是带分页的,默认只显示10条分组数据

// 通过size设置数量
AggregationBuilders.terms("groupBy").field("date").size(Integer.MAX_VALUE);

3、spring-data-elasticsearch聚合结果
spring返回的是Page对象,需要强制转型AggregatedPageImpl才能使用,聚合顶层接口是Aggregation,根据聚合类型不一样,具体实现不一样。如果要获取聚合数值,需要强制转型。
目前我使用到的聚合类型如下:ipRange range terms cardinality
ipRange range terms 的聚合结果都有一个唯一的上层接口

  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
使用 Elasticsearch SQL 插件,您需要先确保您已经安装了 Elasticsearch 7.1.1 版本。然后,按照以下步骤进行操作: 1. 安装 Elasticsearch SQL 插件: - 打开终端或命令提示符窗口。 - 运行以下命令安装 Elasticsearch SQL 插件: ``` ./bin/elasticsearch-plugin install https://github.com/NLPchina/elasticsearch-sql/releases/download/7.1.1.0/elasticsearch-sql-7.1.1.0.zip ``` - 安装完成后,重启 Elasticsearch 以使插件生效。 2. 使用 Elasticsearch SQL: - 打开终端或命令提示符窗口。 - 进入 Elasticsearch 的安装目录。 - 运行以下命令以启动 Elasticsearch SQL 查询: ``` ./bin/elasticsearch-sql-cli ``` - 您将进入 Elasticsearch SQL 的命令行界面。 - 现在,您可以开始使用 SQL 语法来查询 Elasticsearch 数据。 例如,您可以运行以下命令来执行一个简单的 SELECT 查询: ``` SELECT * FROM your_index_name WHERE your_field_name = 'your_value' ``` 注意:在上述查询中,`your_index_name` 是您要查询的索引名称,`your_field_name` 是您要查询的字段名称,`your_value` 是您要匹配的字段值。 这样,您就可以使用 Elasticsearch SQL 插件来执行 SQL 查询并检索 Elasticsearch 中的数据了。请记住,Elasticsearch SQL 插件提供了一种方便的方式来使用 SQL 语法进行查询,但它可能不适用于所有类型的查询,特别是复杂的查询。因此,在使用插件时,请确保您了解其使用限制和适用场景。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值