python 动态迁移solr数据过程解析

本文介绍了如何使用Python分段迁移Solr中的数据。首先通过HTTP接口查询数据,每次处理1000条,删除version键值,然后通过更新接口将处理后的JSON数据提交到目标collection。在不同网络环境中,可将数据写入文件,再在目标服务器上读取上传。同时提供了清除数据的快捷方式。
摘要由CSDN通过智能技术生成

如何把在线的其中一个 collection 里面的数据迁移到另外一个collection下?

思路: collection数据量比较大,所以一次性操作所有数据太大,于是分段执行操作。先分段 按1000条数据量进行查询,处理成json数据,把处理后的json数据 发送到目的collection上即可。

实现:

一、使用http的接口先进行查询

使用如下格式查询:

其中:collection_name 是你查询的collection的名称

rows 是需要查询多少行,这里设置为1000

start 从多少行开始进行查询,待会儿脚本里面就是控制这个参数进行循环查询

http://host:port/solr/collection_name/select?q=*:*&rows=1000&start=0

查询处理后会得到如下图片里面的数据格式,其中

在response里面,有两个键值数据是我们需要的,一个是numFound(总的数据条数),docs(所有json数据都在这里面)

实现:

在docs里面,每条数据都带有version 键值,这个需要给去掉

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值