结合指标数据场景优化查询效率实战

最新推荐文章于 2024-10-09 21:35:58 发布

zhupc_

最新推荐文章于 2024-10-09 21:35:58 发布

阅读量127

点赞数

分类专栏： ElasticSearch 大数据搜索查询分析全指南

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u014296502/article/details/108729430

版权

ElasticSearch 大数据搜索查询分析全指南专栏收录该内容

40 篇文章 5 订阅 ¥49.90 ¥99.00

订阅专栏

本文详细介绍了如何通过ES的Scroll接口优化大数据量查询，避免一次性加载所有数据，降低ES负担。同时，针对不同业务需求，利用策略设计模式重构代码，提高代码的复用性和可维护性，确保查询效率的同时注重代码质量。

摘要由CSDN通过智能技术生成

结合 32 课，继续讨论关于优化查询效率的问题，上个课时中我们使用 es.search(dsl,index) 接口查询出了北京城市的所有天气数据，即使我们使用了 _source 字段控制了不必要的网络输出，但是我们是一次性把北京城市的数据全部都取回来了，并且使用 value_cout 字段统计了有多少条数据，然后设置 size，这里因为 size 比较小，没超过 10000 条，但是如果是上百万条呢？通过 value_cout 获取数据个数，然后再设置 size 一次性取回来吗？

当然是不允许了，无法再划分的取数据需求，我们可以分批取回所有数据，那就是 Scroll 接口。

ES 优化 Scroll

指定 index，指定 DSL，配置 Scroll 有效时间是 2 分钟，每次取 1000 个。关于 Scroll 原理之前的课时也介绍的很清楚了，就是会在 ES 里面生成一个数据快照，Scroll 会直接从这个快照里面取，快照不能够避免脏数据，因为不能够跟 ES 索引保持实时一致，如果数据快照已经生成，ES 索引数据发生改变，那么这更新后的 ES 数据是不会同步到数据快照中的。

data=es.search(index=index,body=dsl,scroll='2m'

了解本专栏

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。