Zookeeper 是如何保证数据一致性的

最新推荐文章于 2024-08-16 18:21:48 发布

锦还之路

最新推荐文章于 2024-08-16 18:21:48 发布

阅读量604

点赞数 1

分类专栏：大数据技术文章标签： zookeeper 分布式

本文链接：https://blog.csdn.net/qq798280904/article/details/129965877

版权

大数据技术专栏收录该内容

15 篇文章 0 订阅

订阅专栏

Zookeeper通过ZAB原子广播协议来实现数据的最终顺序一致性，他是一个类似2PC两阶段提交的过程。
由于Zookeeper只有Leader节点可以写入数据，如果是其他节点收到写入数据的请求，则会将之转发给Leader节点。

Leader收到请求之后，将它转换为一个proposal提议，并且为每个提议分配一个全局唯一递增的事务ID：zxid，然后把提议放入到一个FIFO的队列中，按照FIFO的策略发送给所有的Follower
Follower收到提议之后，以事务日志的形式写入到本地磁盘中，写入成功后返回ACK给Leader
Leader在收到超过半数的Follower的ACK之后，写入成功，发送commit命令给Follower告诉他们提交proposal

ZAB 协议：

ZAB 协议是为分布式协调服务 Zookeeper 专门设计的一种支持崩溃恢复的原子广播协议，实现分布式数据一致性
所有客户端的请求都是写入到 Leader 进程中，然后，由 Leader 同步到其他节点，称为 Follower。在集群数据同步的过程中，如果出现 Follower 节点崩溃或者 Leader 进程崩溃时，都会通过 Zab 协议来保证数据一致性ZAB 协议包括两种基本的模式：
崩溃恢复和消息广播
消息广播：Leader 节点的写入是一个两步操作，第一步是广播事务操作，第二步是广播提交操作，其中过半数指的是反馈的节点数 >=N/2+1。
崩溃恢复：初始化集群，刚刚启动的时候Leader 崩溃，因为故障宕机Leader 失去了半数的机器支持，与集群中超过一半的节点断连此时开启新一轮 Leader 选举，当与过半的机器同步完成后，就退出恢复模式，然后进入消息广播模式。整个 ZooKeeper 集群的一致性保证就是在上面两个状态之前切换，当 Leader 服务正常时，就是正常的消息广播模式；当 Leader 不可用时，则进入崩溃恢复模式，崩溃恢复阶段会进行数据同步，完成以后，重新进入消息广播阶段。

Leader选举

Zxid是极为重要的概念，它是一个long型（64位）整数，分为两部分：纪元（epoch）部分和计数器（counter）部分，是一个全局有序的数字。epoch代表当前集群所属的哪个leader，leader的选举就类似一个朝代的更替，你前朝的剑不能斩本朝的官，用epoch代表当前命令的有效性，counter是一个递增的数字。当其他节点的纪元比自身高投它，如果纪元相同比较自身的myid