ES分页问题

Fuly1024

于 2024-02-13 23:15:56 发布

阅读量814

点赞数 1

分类专栏：面试刷题文章标签： elasticsearch redis 数据库

本文链接：https://blog.csdn.net/xy3233/article/details/135752451

版权

面试刷题专栏收录该内容

39 篇文章 0 订阅

订阅专栏

本文介绍了Elasticsearch中的三种分页方法：浅分页（from+size），滚动分页（scroll）及其变体ScrollScan，以及SearchAfter。滚动分页虽然能保留快照但存在顺序读取和资源占用问题。SearchAfter允许实时反应索引变化，但不支持跳页。

摘要由CSDN通过智能技术生成

分页方式3种

from + size 浅分页
其中，from定义了目标数据的偏移值，size定义当前返回的数目。默认from为0，size为10，即所有的查询默认仅仅返回前10条数据。越往后查询效率越低; 5w条以内勉强可用;
如果搜索size大于10000，需要设置index.max_result_window参数

PUT _settings
{
    "index": {
        "max_result_window": "10000000"
    }
}

scroll 深分页,
滚动读取, 相当于创建一个索引快照,然后按照索引依次去查询;

GET test_dev/_search?scroll=5m
{
  "query": {
    "bool": {
      "filter": [
        {
          "term": {
            "age": 28
          }
        }
      ]
    }
  },
  "size": 10,
  "from": 0,
  "sort": [
    {
      "timestamp": {
        "order": "desc"
      },
      "_id": {
        "order": "desc"
      }
    }
  ]
}

scroll=5m表示设置scroll_id保留5分钟可用。
使用scroll必须要将from设置为0。
size决定后面每次调用_search搜索返回的数量;
然后我们可以通过数据返回的_scroll_id读取下一页内容，每次请求将会读取下10条数据，直到数据读取完毕或者scroll_id保留时间截止;

缺点:
① 不能跳页读取,只能顺序读取;
②历史快照,不能查询实时数据;
③scroll_id会占用大量的资源,尤其是排序(用完后要记得删除)

2.2 Scroll Scan 的遍历与普通 Scroll 一样，初始化存在一点差别,但没有排序功能;
Scroll-Scan结果没按index顺序返回，没有排序，可以提高取数据性能。
2.3 Sliced Scroll 切片并发, 与Scroll Scan类似只是进行切片,然后并发执行;

Search After (ES5之后才有的)
search_after 分页的方式是根据上一页的最后一条数据来确定下一页的位置，同时在分页请求的过程中，如果有索引数据的增删改查，这些变更也会实时的反映到游标上。但是需要注意，因为每一页的数据依赖于上一页最后一条数据，所以无法跳页请求。这就要求每个文档必须有一个全局唯一值

参考: https://juejin.cn/post/7092046739414204430

Fuly1024

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
ES分页问题

然后我们可以通过数据返回的_scroll_id读取下一页内容，每次请求将会读取下10条数据，直到数据读取完毕或者scroll_id保留时间截止;2.3 Sliced Scroll 切片并发, 与Scroll Scan类似只是进行切片,然后并发执行;2.2 Scroll Scan 的遍历与普通 Scroll 一样，初始化存在一点差别,但没有排序功能;参考: https://juejin.cn/post/7092046739414204430。scroll=5m表示设置scroll_id保留5分钟可用。
复制链接

扫一扫

专栏目录