Result window is too large, from + size must be less than or equal to: [10000] but was [10010]. See the scroll api for a more efficient way to request large data sets. This limit can be set by changing the [index.max_result_window] index level setting.
这个报错信息其实已经说的很明确了,通过这种分页方式查询的最大值是 10000,超过 10000 就会报错。
解决办法也很简单,一是针对大数据量查询采用 scroll 方式;二是增加 index.max_result_window
值的大小,使其支持查询范围。
推荐使用 scroll 方式。
scroll 方式
可能会出现的问题:
Trying to create too many scroll contexts. Must be less than or equal to: [500]. This limit can be set by changing the [search.max_open_scroll_context] setting.
产生这个错误的原因是:
当有大量需要使用 scroll 的请求向 Elasticsearch 请求数据时,系统默认最大 scroll_id 数量是 500,当达到最大值时,导致部分请求没有 scroll_id 可用,产生报错。
特别是在高并发场景下,这种问题可能会更加常见。
解决办法可以增加 search.max_open_scroll_context
值的大小。
但这么解决并不好,更好的办法是查询完之后,及时清理 scroll_id。
python
from elasticsearch import Elasticsearch
client = Elasticsearch(host, http_auth=(username, password), timeout=3600)
es_data = client.search(es_index, query_body, scroll=‘1m’, size=100)
scroll_id = es_data[‘_scroll_id’]
client.clear_scroll(scroll_id=scroll_id) # 清理方法
其实,即使我们不手动清理,等过期之后,游标也会自己释放,这跟使用时的参数有关。
比如 scroll='1m'
代表 1min 后会释放。
但就像我们使用其他资源一样,使用完之后及时释放,养成良好的编码习惯,系统才能更健壮。
参考文档:
自我介绍一下,小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。
深知大多数Python工程师,想要提升技能,往往是自己摸索成长或者是报班学习,但对于培训机构动则几千的学费,着实压力不小。自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!
因此收集整理了一份《2024年Python开发全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友,同时减轻大家的负担。
既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上前端开发知识点,真正体系化!
由于文件比较大,这里只是将部分目录大纲截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且后续会持续更新
如果你觉得这些内容对你有帮助,可以扫码获取!!!(备注Python)
由于文件比较大,这里只是将部分目录大纲截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且后续会持续更新*
如果你觉得这些内容对你有帮助,可以扫码获取!!!(备注Python)