Hbase数据迁移——实体机房集群跨网到EMR集群

分享在做数据迁移方案时,因两个集群的hbase、hadoop版本不一致,采用了以下方案步骤:

1、需要在old cluster  hbase停掉的情况下迁移或者停止收集数据进入hbase,保证迁移后的数据一致性

2、两个集群必须都配置外网IP,且new cluster每台服务器要把old cluster的所有外网IP、主机名配置hosts

3、在new cluster上执行hadoop distcp  -skipcrccheck -update -i  -m 200 <src>  <target>,具体命令参数代表什么意思,如不明白的请看官方文档,本人在迁移用到的命令hadoop distcp  -skipcrccheck -update -i -m 200  hftp://xxx.xxx.xxx.xxx:50070/hbase/表名     hdfs://xxx.xxx.xxx.xxx:9000/hbase/data/default/表名,路径查看hbase的存储配置即可知道

4、迁移完后需要在new cluster执行以下修复命令、一般执行前三个就可以进行修复了,如果还不行再执行第四个命令,为了方便写了批量迁移脚本修复 ,全部命令执行,出现 Status: OK表示成功

hbase hbck -fixTableOrphans  表名
hbase hbck -fixMeta  表名
hbase hbck -fixAssignments  表名
hbase hbck -repair  表名


对于数据量特别大的,带宽(old cluster可视情况加大,new cluster能通信即可,对带宽无要求),提高迁移速度,同时请考虑流量费用,毕竟是外网传输,内网迁移可以忽略,迁移过程遇到的各种问题,绝对是个挑战,祝君迁移顺利14.gif





  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值