elasticsearch 深入 —— Scroll滚动查询

最新推荐文章于 2024-09-28 15:46:20 发布

gmHappy

最新推荐文章于 2024-09-28 15:46:20 发布

阅读量2.5w

点赞数 3

分类专栏： ELK elasticsearch

本文链接：https://blog.csdn.net/ctwy291314/article/details/82751898

版权

本文深入探讨Elasticsearch的Scroll API，包括如何使用scroll-scan进行高效滚动，保持搜索上下文存活，清除scroll，以及Sliced Scroll。Scroll适用于处理大量数据，如重新索引，初始请求设置`scroll`参数，后续使用`_scroll_id`从`_scroll` API获取下一批结果。注意，Scroll返回的是快照，不反映实时变化。Sliced Scroll则允许并行处理，提高效率。

摘要由CSDN通过智能技术生成

Scroll

search 请求返回一个单一的结果“页”，而 scroll API 可以被用来检索大量的结果（甚至所有的结果），就像在传统数据库中使用的游标 cursor。

滚动并不是为了实时的用户响应，而是为了处理大量的数据，例如，为了使用不同的配置来重新索引一个 index 到另一个 index 中去。

client 支持：Perl 和 Python

注意：从 scroll 请求返回的结果反映了 search 发生时刻的索引状态，就像一个快照。后续的对文档的改动（索引、更新或者删除）都只会影响后面的搜索请求。

为了使用 scroll，初始搜索请求应该在查询中指定 scroll 参数，这可以告诉 Elasticsearch 需要保持搜索的上下文环境多久（参考Keeping the search context alive），如 ?scroll=1m。

POST /twitter/tweet/_search?scroll=1m 
{
    "query": {
        "match" : {
            "title" : "elasticsearch"
        }
    }
}

使用上面的请求返回的结果中包含一个 scroll_id，这个 ID 可以被传递给 scroll API 来检索下一个批次的结果。

POST /_search/scroll
{
    "scroll" : "1m", 
    "scroll_id" : "c2Nhbjs2OzM0NDg1ODpzRlBLc0FXNlNyNm5JWUc1" 
}

GET 或者 POST 可以使用
URL不应该包含 index 或者 type 名字——这些都指定在了原始的 search 请求中。
scroll 参数告诉 Elasticsearch 保持搜索的上下文等待另一个 1m
scroll_id 参数

每次对 scroll API 的调用返回了结果的下一个批次知道没有更多的结果返回，也就是直到 hits 数组空了。

为了向前兼容，scroll_id 和 scroll 可以放在查询字符串中传递。scroll_id 则可以在请求体中传递。

curl -XGET 'localhost:9200/_search/scroll?scroll=1m' -d 'c2Nhbjs

最低0.47元/天解锁文章

gmHappy

关注

3
点赞
踩
18

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录