es报错nested: QueryPhaseExecutionException[Result window is too large, from + size must be less than .

最新推荐文章于 2024-05-18 17:42:51 发布

九块钱

最新推荐文章于 2024-05-18 17:42:51 发布

阅读量1.2k

点赞数

分类专栏： elasticsearch

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/gshdmdm/article/details/100110582

版权

elasticsearch 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

遇到问题

最近在做爬虫数据分页查询业务，整个数据量大概在100w左右。分页查询数据量超过10000时就会报此错误，即from+size>10000。

示例

超出范围

分析问题

官方限制最大检索为10000条。

为什么这样处理

分页查询一般只会查询前几百条或者上千条，上万的很少很少。
es为分布式分片存储，分页查询涉及到数据的汇总、排序再分页，导致效率低下，当form更大时可能会直接拖垮机器。
官方提供了scroll游标API用于处理大数据，这里不做介绍。
切记scroll是用于大批量导出数据到其他地方，切记scroll是用于大批量导出数据到其他地方，切记scroll是用于大批量导出数据到其他地方。

解决方案

调整index.max_result_window即可恢复正常使用

后续建议

将数据按时间筛选如以月为单位，保证每次数据量在一个可控范围内。
为此类数据搭建单独的es服务保障可用性的情况下尽量避免过多机器参与。

以上均为个人见解，如有不对欢迎多多指正，共同学习进步。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
es报错nested: QueryPhaseExecutionException[Result window is too large, from + size must be less than .

遇到问题最近在做爬虫数据分页查询业务，整个数据量大概在100w左右。分页查询数据量超过10000时就会报此错误，即from+size>10000。示例分析问题官方限制最大检索为10000条。为什么这样处理分页查询一般只会查询前几百条或者上千条，上万的很少很少。es为分布式分片存储，分页查询涉及到数据的汇总、排序再分页，导致效率低下，当form更大时可能会直接拖垮机器。官方...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。