hbase replication 原理

最新推荐文章于 2023-12-25 09:30:00 发布

baiyangfu

最新推荐文章于 2023-12-25 09:30:00 发布

阅读量6.4k

点赞数

分类专栏： hbase

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/baiyangfu_love/article/details/38682349

版权

本文档分析了HBase的复制原理，详细描述了在主集群中3个Region Server向单个从节点复制的过程。当1.1.1.2失去ZooKeeper会话时，其他节点竞争创建锁，1.1.1.3获胜并开始转移队列。如果1.1.1.3在完成1.1.1.2的WAL复制之前失败，最后的存活节点将尝试锁定1.1.1.3的节点并继续转移队列。此外，还介绍了HBase复制的指标监控。

摘要由CSDN通过智能技术生成

查看文档，分析了一下 hbase replication的原理，简单记录一下：

http://hbase.apache.org/book.html#cluster_replication

hbase 的复制方式是 master-push 方式，即主集群推的方式，主要是因为每个rs都有自己的WAL。一个master集群可以复制给多个从集群

复制是异步的，运行集群分布在不同的地方，这也意味着从集群和主集群的数据不是完全一致的。他的目标就是最终一致性

复制的格式与mysql的机遇状态的复制类似，不同于mysql的状态复制，整个WAL的修改（包括insert delete 和cell的修改）都会安装顺序的复制到从集群中。

WAL必须保存在hdfs直到所有的从集群复制完成

每个regionserver会记录最后复制的位置，然后每次复制都从最后复制的位置开始。rs会维持一个replication的队列，每个slave的的position都会单独维护

WAL 操作的生命周期：

1、客户端插入或删除

2、rs将操作以可以回放的格式写入wal

3、如果影响的cell正是replication的范围之内的cell，将操作放入replication的队列

4、如果slave rs 无法工作，master会重新选择新的rs作为replication的slave rs，并重新发送buffer中的数据

5、同时，wal 会被压缩并且存储到zookeeper的队列中，server rs通过移动操作日志的路径到一个中心的日志路径将操作日志归档。然后将path更新到内存中replication 线程的队列中

6、如果slave集群最终恢复正常，master会将中断复制这些log按照正常复制过程复制

replication内部原理：

hbase复制的状态都存储在zookeeper中，默认情况下，存储到 /hbase/replication。这个目录有两个子节点： peers znode 和 RS znode

如果人为的删除 /hbase/replication 节点，会造成复制丢失数据

peers znode：

存储在 zookeeper中 /hbase/replication/peers 目录下，这

最低0.47元/天解锁文章

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
hbase replication 原理

查看文档，分析了一下 hbase replication的原理，简单
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。