对于使用elasticsearch的用户而言有个事情不可避免,也比较棘手,那就是索引库的迁移,包括它的数据、mapping等等信息,最近公司正好遇到了这个问题,需要对集群数据进行迁移,在网上查了很多资料,自己又通过自己的实际情况做了一次数据迁移工作,折腾了几天终于尘埃落定了,为此就在这里总结一下迁移的过程。
一、问题背景
因为原来的服务器集群容量比较少,应用型的服务器容量也就是30G左右,对于大几千万的数据肯定是吃不了的,导致后续数据存储不了了,可能有人会说增加节点不就行了,是呀,我也想这么干呀,无奈的是对于公司 而言得考虑成本,一台服务器成本十几万,预估了下全部数据弄完大概需要8台,几百万就没了,因此在本地搭了三台服务器,每台容量500G。集群搭好后就开始进行数据迁移了。
二、迁移方式
对于数据的迁移网上也有很多方式,本文用的是snapshot快照的方式,这种方式速度快,并且很适用于大数据量的迁移。
三、遇到的问题
(1)对于源集群的快照生成,容量不够问题,迁移的原因就是容量不够,快照怎么生成呢?解决办法是挂载到一台新的服务器进行快照的生成
(2)拷贝快照也是问题,对于内网服务器而言,外网不