python ES使用scorll获取单个索引的全量数据

Exceirdo

已于 2024-08-01 15:16:41 修改

阅读量457

点赞数 10

分类专栏：笔记文章标签： python elasticsearch

于 2023-12-28 12:57:54 首次发布

本文链接：https://blog.csdn.net/qq_44731429/article/details/135266602

版权

笔记专栏收录该内容

5 篇文章 0 订阅

订阅专栏

想必已对scroll的用法已有基本了解
滚动获取数据的关键在于，第一次使用scroll_id获取第一批数据的时候，同时下一个scroll_id也放在了第一次获取数据的返回体中了。
python代码（requests版）：

# -*- coding: utf-8 -*-
import requests

host = "xx.xx.xx.xx"
r = requests.get(
    url="http://{}:9200/index_name/_search?scroll=1m&size=10000".format(host),
    json={},
    auth=("user", "password"),
    headers={'Content-Type': 'application/json'}
).json()
scroll_id = r['_scroll_id']

while True:
    data = r['hits']['hits']
    
    # 数据遍历完成，跳出
    if data == []:
        break
        
    # 数据处理，组合也好，保存也好
    for i in data:
        source = i['_source']

    r = requests.get(
        url="http://{}:9200/_search/scroll".format(host),
        json={"scroll": "1m", "scroll_id": scroll_id},
        auth=("user", "password"),
        headers={'Content-Type': 'application/json'}
    ).json()

    # 更新scroll_id
    scroll_id = r['_scroll_id']

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Exceirdo

关注关注

10
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
python ES使用scorll获取单个索引的全量数据

滚动获取数据的关键在于，第一次使用scroll_id获取第一批数据的时候，同时下一个scroll_id也放在了第一次获取数据的返回体中了。想必已对scroll的用法已有基本了解。
复制链接

扫一扫