elasticsearch java 分页查询_elasticsearch深度分页问题

最新推荐文章于 2024-08-12 15:55:14 发布

weixin_39827775

最新推荐文章于 2024-08-12 15:55:14 发布

阅读量423

点赞数

文章标签： elasticsearch java 分页查询

本文链接：https://blog.csdn.net/weixin_39827775/article/details/114726775

版权

正版包邮elasticsearch实战与原理

70.1元

包邮

(需用券)

去购买 >

elasticsearch分页对于用过es的人应该都会使用，和数据库的分页类似，如下所示，通过from + size可以对数据进行分页。

{

"from" : 0,

"size" : 10,

"query" : {

"term" : { "user" : "dejun" }

}

可以查询1-10条记录，不过由于es是分布式的，数据都是分布在多个分片上。

如查询： from = 990 , size = 10 , 分片数为：4 ，那么es是如何查询的呢？如下图所示：

es会在每个分片获取1000条文档，通过Coordinating Node 汇总各个节点的数据，再通过排序选择前1000个文档返回。

所以当页数越深，查询的节点的数量越大，自然占用的内存也越多，那么我们是不是可以把系统内存查爆？ ES为了避免深度分页带来的内存开销，ES默认限定只能查询10000个文档

那么我们做个示范：

POST /demo/_search

{

"from" : 0 ,

"size" : 10001 ,

"query" : {

"match_all":{}

}

ES会报以下错误：

Result window is too large, from + size must be less than or equal to: [10000] but was [10001]. See the scroll api for a more efficient way to request large data sets. This limit can be set by changing the [index.max_result_window] index level parameter.

以上可见，from + size 这种方式不适用于深度分页场景，下面介绍其它两种分页方式…

Search After

Scroll Api

Search After

可以避免深度分页带来的性能问题，可以实时的获取下一页文档

不支持指定页数，只能向下翻

需要加入排序 sort,并且排序的字段一定要是唯一的

示例：

POST /demo/_search

{

"size": 3,

"query": {