elasticsearch 深入 —— Search After实时滚动查询

最新推荐文章于 2025-08-10 18:34:19 发布

gmHappy

最新推荐文章于 2025-08-10 18:34:19 发布

阅读量3.6w

点赞数 3

CC 4.0 BY-SA版权

分类专栏： ELK elasticsearch 文章标签：实时并行滚动查询 search after

本文链接：https://blog.csdn.net/ctwy291314/article/details/82754652

ELK 同时被 2 个专栏收录

47 篇文章

订阅专栏

elasticsearch

46 篇文章

订阅专栏

本文介绍Elasticsearch中深度分页的解决方案——search_after参数的使用方法。通过实例展示了如何利用这一参数进行高效的深度分页操作。

Search After

一般的分页需求我们可以使用form和size的方式实现，但是这种分页方式在深度分页的场景下应该是要避免使用的。深度分页会随着请求的页次增加，所消耗的内存和时间的增长也是成比例的增加，为了避免深度分页产生的问题，elasticsearch从2.0版本开始，增加了一个限制：

index.max_result_window =10000

建议使用Scroll api进行高效深度滚动，但滚动上下文代价很高，建议不要将其用于实时用户请求。该search_after参数通过提供实时游标来解决此问题。

检索第一页的查询如下所示：

POST twitter/_search
{
    "size": 10,
    "query": {
        "match" : {
            "title" : "elasticsearch"
        }
    },
    "sort": [
        {"date": "asc"},
        {"_id": "desc"}
    ]
}

每个文档具有一个唯一值的字段应该用作排序规范的仲裁器。否则，具有相同排序值的文档的排序顺序将是未定义的。建议的方法是使用字段_id，它肯定包含每个文档的一个唯一值。

上面的请求会为每一个文档返回一个包含sort排序值的数组。这些sort排序值可以被用于 search_after 参数里以便抓取下一页的数据。比如，我们可以使用最后的一个文档的sort排序值，将它传递给 search_after 参数：

GET twitter/_search
{
    "size": 10,
    "query": {
        "match" : {
            "title" : "elasticsearch"
        }
    },
    "search_after": [1463538857, "654323"],
    "sort": [
        {"date": "asc"},
        {"_id": "desc"}
    ]
}