HDFS跨集群复制数据
hadoop distcp hdfs://ubuntu:9000/user/root hdfs://hadoop-master:9000/user/root
注意:机器名后面的9000端口不可省略,因为distcp命令默认使用8020端口,如果省略会报告ConnectionRefused异常。
HBASE数据导出
直接使用HBASE提供的exort和import工具,这些工具包含在HBASE的jar包中。他们使用MAPREDUCE进行导入导出操作,可以将部分或全部表写入到HDFS文件中。
hadoop jar hbase-0.94.10.jar export -Dhbase.client.scanner.caching=100 weather_data /weather_data
export命令后面,用户必须从左到右指定参数,不能省略这中间任何一个参数。
使用distcp命令将导出的文件复制到目标集群以后再使用导入命令进行导入。
HBASE数据导入
hadoop jar hbase-0.94.10.jar import weather_data /weather_data
成功!