HBase中数据的导入导出

        在实际应用HBase过程中,经常需要将生产环境中的数据备份,或者需要在开发环境中利用生产环境的数据,因此HBase存储的数据的导入导出必不可少,HBase内置提供了一个的导出工具,使数据很容易从hbase表导入HDFS目录下的SequenceFiles文件。该工具创造了一个map reduce任务,通过一系列HBase API来调用集群,获取指定表格的每一行数据,并且将数据写入指定的HDFS目录中。这个工具对集群来讲是性能密集的,因为它使用了mapreduce和HBase 客户端API。但是它的功能丰富,支持制定版本或日期范围,支持数据的筛选,从而使增量备份可用。

下面是HBASE导入导出的一个样例过程:

1、切换到hbase bin的目录下,将HBase中表复制导出到HDFS中,执行:

hbase org.apache.hadoop.hbase.mapreduce.Export test_table/data/test_table

上述中,test_table是HBase中要导出的表名,/data/test_table是hadoop fs(hadoop文件系统)中的位置。

2、切换到hadoop bin目录下,将hadoop HDFS中的文件拷贝到本地linux路径:

hadoop fs -get /data/test_table ~/

上述中,/data/test_table是hadoop HDFS文件系统中的路径,~/是本地linux路径。

3、切换到hadoop bin目录下,将linux中的本地文件拷贝到Hadoop HDFS中:

hadoop fs -put ~/test_table /data/

其中,~/test_table是本地Linux文件,/data/是Hadoop HDFS文件路径

4、拷贝好数据后,需要创建我们要导入数据的表,进入hbase shell环境:

create‘test_table','test_family'

注意:创建表的时候,需要至少指定一个列簇

5、将Hadoop HDFS中的文件,导入到指定的HBase的表:

hbase org.apache.hadoop.hbase.mapreduce.Import test_table /data/test_table

转载于:https://my.oschina.net/wca/blog/1830731

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值