elasticsearch结果窗口限制10000[from+size小于或等于10000]

一、问题描述

Elasicsearch版本7.8,执行DSL查询

GET /my_test_sort/_search
{
  "query": {
    "match_all": {}
  },
  "from": 1,
  "size": 10000
}

结果Elasicsearch报如下错误

Result window is too large, from + size must be less than or equal to: [10000] but was [10001]. 
See the scroll api for a more efficient way to request large data sets. 
This limit can be set by changing the [index.max_result_window] index level setting.

其实Elasicsearch这个错误已经提示的很明显了,甚至提出了解决方案。大概意思是说:结果窗口太大,from+size必须小于或等于10000,但我们检索的DSL中from+size=10001。我们在查询大量数据时可以采用 scroll api 这种高效的方式。结果窗口大小可以修改索引参数:max_result_window进行设置

二、问题分析

其实问题已经很明了了,我们可以查看相关官网的解释进一步赘述
在这里插入图片描述
Elasicsearch通过index.max_result_window参数控制了能够获取的数据总数from+size的最大值,默认是10000条。但是,由于数据需要从其它节点分别上报到协调节点,因此搜索请求的数据越多,会导致在协调节点占用分配给Elasticsearch的堆内存和搜索、排序时间越大。针对这种满足条件数量较多的深度搜索,官方建议我们使用Scroll

三、解决方案

已经创建好的索引,可以动态的修改max_result_window的大小

PUT /my_test_sort/_settings?preserve_existing=true
{
  "max_result_window": "200000"
}

新建索引的时候可以直接指定max_result_window的大小

PUT index_name
{
  "settings": {
    "max_result_window": "200000"
  }
}

如果没有执行DSL的环境,可以直接在服务器上执行


curl -H "Content-Type: application/json" -X PUT 'http://127.0.0.1:9200/my_test_sort/_settings?preserve_existing=true' -d '{"max_result_window" : "200000"}'

max_result_window支持的最大返回数是2^31-1,也就是2147483647

  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Elasticsearch中,使用form和size参数进行分页查询是一种常见的方式。但是,当数据量很大时,这种方法会遇到一些限制,因为它需要将所有结果加载到内存中,并在内存中进行分页处理,这会导致较高的内存使用和较低的查询性能。为了解决这个问题,可以使用search_after参数,它可以让你在翻页时直接跳过之前的结果。 使用search_after参数的步骤如下: 1. 首先,需要获取第一页的结果,这可以通过使用排序字段并设置sort参数来实现。例如,如果你想按时间戳排序,则可以使用以下命令: ``` GET /my-index/_search { "query": { "match_all": {} }, "sort": [ { "timestamp": "desc" } ], "size": 10 } ``` 这将返回最新的10个文档,并按时间戳进行排序。 2. 获取第一页结果后,你需要获取下一页的结果。为此,你需要获取上一页结果的最后一个文档,并将其传递给search_after参数。例如,如果你想获取第二页的结果,则可以使用以下命令: ``` GET /my-index/_search { "query": { "match_all": {} }, "sort": [ { "timestamp": "desc" } ], "size": 10, "search_after": [last_timestamp] } ``` 这里,last_timestamp是上一页结果的最后一个文档的时间戳。Elasticsearch将跳过所有小于等于last_timestamp的文档,并返回下一页的10个文档。 至于解决10000条数据的限制,可以通过以下两种方式: 1. 使用scroll API:scroll API可以将查询结果分批加载到内存中,并在内存中进行分页处理。这种方法可以避免内存使用过高的问题。 2. 使用分片:如果你的数据集非常大,可以考虑使用分片来将数据分成多个部分。这样,你可以在多个节点上并行处理查询,并减少单个节点的负载,从而提高查询性能。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值