Hive数据仓库迁移
hadoop distcp hftp://bdc220.hexun.com:50070/dw /
建hive映射表即可
HBase迁移
hadoop distcp hftp://bdc220.hexun.com:50070/hbase /
HBase表结构考备后直接可用
distcp 命令集群数据考备
参数一: 源集群(旧)
参数二: 目标集群(新)
如出现异常:
Caused by: java.io.IOException: Check-sum mismatch between
解决方法:
hdfs-site.xml将dfs.checksum.type属性设置为CRC32
<property>
<name>dfs.checksum.type</name>
<value>CRC32</value>
</property>
hadoop distcp -update -skipcrccheck hftp://X.X.X.X:50070/user/dd_edw/warehouse/X/dt=2014-04-10 /user/impala/warehouse/1