hbase 备份

最新推荐文章于 2022-04-12 00:05:55 发布

mllhxn

最新推荐文章于 2022-04-12 00:05:55 发布

阅读量396

点赞数

分类专栏： hbase 文章标签： hbase 备份

hbase 专栏收录该内容

22 篇文章 0 订阅

订阅专栏

1、 replication，

通过类似mysql 主从复制方式进行复制，基于HLog

在应用场景个人感觉比较重要的一点是可以隔离计算分析型的操作和实时性操作带来的影响。

对于DDL操作不做复制，过实时读取hlog中的entry来解析变更的数据然后发送到从集群中去。

2、 distcp，

表数据文件的copy

./hadoopdistcp hdfs://wxlab58:9100/hbase/lsmp_lottery_new_3/ hdfs://wxlab24:9100/hbase/lsmp_lottery_new_3/

<property>

<name>dfs.permissions</name>
<value>false</value>

</property>

或者

$ hadoop fs-chmod 777 /user/hadoop

然后在目的hbase上执行./hbase org.jruby.Mainbin/add_table.rb /hbase/lsmp_lottery_new_3,更新元数据表meta

生成meta信息后，重启hbase

表可以不在线，是mapreuce操作，不可垮表操作，全量操作

3、 copyTable，

热备，scan和put的mapreduce操作，无法保证一致性，

增量copy, –starttime and –endtime arguments

只copy部分cf,–families=srcCf1,srcCf2

$bin/hbase org.apache.hadoop.hbase.mapreduce.CopyTable [--starttime=X][--endtime=Y] [--new.name=NEW] [--peer.adr=ADR] tablename

$HADOOP_HOME/bin/hadoopjar $HBASE_HOME/hbase-

0.92.1.jarcopytable --families=n --peer.adr=l-master1:2181:/

hbase--new.name=hly_temp2 hly_temp

表必须在线，是mapreduce操作，可以跨表操作，可以增量操作

4、 export，

把表数据导出到hdfs文件中(mapreduce操作)

数据被写到了相应的目录，一个region一个文件。默认为sequencefile。可以选择对输出进行压缩等。

bin/hbaseorg.apache.hadoop.hbase.mapreduce.Export <tablename> <outputdir>[<versions> [<starttime> [<endtime>]]]

$HADOOP_HOME/bin/hadoopjar $HBASE_HOME/hbase-

0.92.1.jarexport -D mapred.output.compress=true -D mapred.output.

compression.codec=org.apache.hadoop.io.compress.BZip2Codec-D

mapred.output.compression.type=BLOCK hly_temp /backup/hly_temp

表必须在线（热备），是mapreduce操作，可以跨表操作，可以增量操作

5、 import，

基于dump的hdfs文件，进行数据恢复(mapreduce操作)

bin/hbaseorg.apache.hadoop.hbase.mapreduce.Import <tablename> <inputdir>

$HADOOP_HOME/bin/hadoopjar $HBASE_HOME/hbase-

0.92.1.jarimport hly_temp /backup/hly_temp

表必须在线（热备），是mapreduce操作，可以跨表操作，可以实现增量操作

6、 Bulkload tool，

Bulkload对于添加表的大量的数据效率很高，绕过put操作的WAL、compact&flush、GC等资源开销。

一个region一个HFile,在bulk load时候，自动把HFile mv到对应region的目录下。

A、通过mapreduce，生成HFile，后bulkload

HTabletable = new HTable(conf, tableName);

job.setReducerClass(PutSortReducer.class);

PathoutputDir = new Path(args[2]);

FileOutputFormat.setOutputPath

(job,outputDir);

job.setMapOutputKeyClass

(ImmutableBytesWritable.class);

job.setMapOutputValueClass(Put.class);

HFileOutputFormat.configureIncrementalLoad(job, table);

hadoop jar hbase-VERSION.jar completebulkload /user/todd/myoutput mytable

或者LoadIncremental.doBulkLoad把HFile load到HBase表中。

B、importtsv通过mapreduce，直接导入到表中

$HADOOP_HOME/bin/hadoopjar $HBASE_HOME/hbase-

0.92.1.jarimporttsv \

-Dimporttsv.columns=HBASE_ROW_KEY,t:v01,t:v02,t:v03,t:v04,t:v0

5,t:v06,t:v07,t:v08,t:v09,t:v10,t:v11,t:v12,t:v13,t:v14,t:v15,t:v1

6,t:v17,t:v18,t:v19,t:v20,t:v21,t:v22,t:v23,t:v24\

hly_temp\

/user/hac/input/2-1

C、importtsv通过mapreduce生成HFile，后bulkload到表中

$HADOOP_HOME/bin/hadoop jar$HBASE_HOME/hbase-

0.92.1.jar importtsv \

-Dimporttsv.bulk.output=/user/hac/output/2-1\

-Dimporttsv.columns=HBASE_ROW_KEY,t:v01,t:v02,t:v03,t:v04,

t:v05,t:v06,t:v07,t:v08,t:v09,t:v10,t:v11,t:v12,t:v13,t:v14,

t:v15,t:v16,t:v17,t:v18,t:v19,t:v20,t:v21,t:v22,t:v23,t:v24\

hly_temp \

/user/hac/input/2-1

$HADOOP_HOME/bin/hadoop jar$HBASE_HOME/hbase-

0.92.1.jar completebulkload \

/user/hac/output/2-1 \

hly_temp

表在线，支持增量操作

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
hbase 备份

1、 replication，通过类似mysql 主从复制方式进行复制，基于HLog在应用场景个人感觉比较重要的一点是可以隔离计算分析型的操作和实时性操作带来的影响。对于DDL操作不做复制，过实时读取hlog中的entry来解析变更的数据然后发送到从集群中去。 2、 distcp，表数据文件的copy./hadoopdistcp
复制链接

扫一扫

专栏目录

mllhxn CSDN认证博客专家 CSDN认证企业博客

码龄12年

122: 原创

9万+: 周排名

165万+: 总排名

51万+: 访问

: 等级

5995: 积分

116: 粉丝

86: 获赞

41: 评论

350: 收藏

私信

关注

热门文章

分类专栏

hadoop 25篇
hbase 22篇
hive 19篇
java 28篇
linux 13篇
cdh 28篇
oracle 11篇
sdk 5篇
spark 44篇
elk 19篇
DataWarehouse 2篇
应用 4篇
scala 9篇
kafka 8篇
JVM 13篇
zk 8篇
mongodb 4篇
docker 2篇
netty 6篇

最新评论

grpc 简单实例
不要脸的程序员: 有git地址吗
记一次耗时毛刺排查
cjg陈平安: 这明显是定时任务，不矛盾吗？
聚类算法实例
程序小小萌新: 请问下这个数据集是什么意思呢？
一种根据关键字进行分类的文本分类算法
说文科技: 没有给出原文链接的转载都是不负责任的。
Docker绑定固定IP/跨主机容器互访
杰郭.斯坦达: 你第三部是怎么ping通另一台虚拟机和百度的？我这里做了多次，直接ping另一台主机是ping不通的，ping百度更不可能ping通了。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。