背景
有一个HBase集群运行在k8s中,只通过NodePort的方式对外暴露了Zookeeper端口,这意味着该hbase集群只能在k8s内部提供服务。现在k8s集群需要下线,需要将hbase集群里的数据迁移到一套新部署的hbase集群中
迁移方案
1.由于在集群外无法访问到hbase,所以源集群的操作在pod里面进行。新集群正常暴露端口和提供服务
2.采用snapshot的方式进行迁移
操作步骤
1. 进入pod
源集群:kubectl exec -n hbase hbase-hbase-master -it /bin/sh
2. 生产快照
源集群:bin/hbase
snapshot 'xxx_namespace:xxx_table','xxx_namespace.xxx_table_snapshot'
3. 跨集群迁移快照
源集群:bin/hbase org.apache.hadoop.hbase.snapshot.ExportSnapshot -snapshot xxx_namespace.xxx_table_snapshot -copy-to hdfs://namenode_ip:namenode_rpc_port/path/to/hbase/root/dir
该步骤会自动将快照信息添加到新集群的hbase中,可以list_snapshots看到
4. 因为3中的操作会把生产的目录改成hdfs:hdfs,在新集群中无法识别,故需要修改目标集群快照目录的权限
目标集群:hdfs dfs -chown -R hbase:hdfs /path/to/hbase/root/dir/archive
目标集群:hdfs dfs -chown -R hbase:hdfs /path/to/hbase/root/dir/.hbase-snapshot
5. 导入快照需要提前创建好表,所以需要先在源集群describe table,将查询到的表结构复制到新集群。并禁用表
源集群:describe 'xxx_namespace:xxx_table'
目标集群:create 'xxx_namespace:xxx_table',{describe result(注意去掉换行符)}
目标集群:disable 'xxx_namespace:xxx_table'
6. 从快照中恢复表,并启用
目标集群:restore_snapshot 'xxx_namespace.xxx_table_snapshot'
目标集群:enable 'xxx_namespace:xxx_table'
7. 校验表行数
源集群:count 'xxx_namespace:xxx_table'
目标集群:count 'xxx_namespace:xxx_table'