ZAB协议对分布式一致性的保证

最新推荐文章于 2024-07-19 22:27:09 发布

coderlong

最新推荐文章于 2024-07-19 22:27:09 发布

阅读量667

点赞数 1

分类专栏： Zookeeper 文章标签： Zookeeper 分布式事务

本文链接：https://blog.csdn.net/qq_33797928/article/details/97620727

版权

Zookeeper 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

在前面，我讲了Raft协议在分布式环境下的作用，这篇讲解ZK的ZAB协议算法。
谈到ZAB协议，不得不提的是Paxos算法，可是Paxos就如所有的书和博客里面说的那样，的确让人很难理解，我尝试看了很多相关的资料，对他的概念还是一知半解，raft算是对Paxos的一种可理解的实现。

Zab协议的全称是 Zookeeper Atomic Broadcast （Zookeeper原子广播）。
Zookeeper 是通过 Zab 协议来保证分布式事务的最终一致性。

Zab协议是为分布式协调服务Zookeeper专门设计的一种支持崩溃恢复的原子广播协议，是Zookeeper保证数据一致性的核心算法。Zab借鉴了Paxos算法，但又不像Paxos那样，是一种通用的分布式一致性算法。它是特别为Zookeeper设计的支持崩溃恢复的原子广播协议。
在Zookeeper中主要依赖Zab协议来实现数据一致性，基于该协议，zk实现了一种主备模型（即Leader和Follower模型）的系统架构来保证集群中各个副本之间数据的一致性。
这里的主备系统架构模型，就是指只有一台客户端（Leader）负责处理外部的写事务请求，然后Leader客户端将数据同步到其他Follower节点。

ZAB的协议核心是在整个zookeeper集群中只有一个节点即Leader将客户端的写操作转化为事物(或提议proposal)。Leader节点再数据写完之后，将向所有的follower节点发送数据广播请求(或数据复制)，等待所有的follower节点反馈。在ZAB协议中，只要超过半数follower节点反馈OK，Leader节点就会向所有的follower服务器发送commit消息。即将leader节点上的数据同步到follower节点之上。

ZAB协议分为两部分，一是消息广播模式，二是崩溃回复模式

消息广播模式

在zookeeper集群中数据副本的传递策略就是采用消息广播模式。zookeeper中数据副本的同步方式与二阶段提交相似但是却又不同。二阶段提交的要求协调者必须等到所有的参与者全部反馈ACK确认消息后，再发送commit消息。
要求所有的参与者要么全部成功要么全部失败。
但是两阶段提交的缺点也十分明显

同步阻塞
数据不一致
太过保守
ZAB 对此进行了改进，在ZAB协议的提交过程中，移除了中断逻辑，所有的Follower要么反馈ACK，要么抛弃Leader。

zookeeper中消息广播的具体步骤如下：
1.1 客户端发起一个写操作请求
1.2 Leader服务器将客户端的request请求转化为事物proposql提案，同时为每个proposal分配一个全局唯一的ID，即ZXID。
1.3. leader服务器与每个follower之间都有一个队列，leader将消息发送到该队列
1.4. follower机器从队列中取出消息处理完(写入本地事物日志中)毕后，向leader服务器发送ACK确认。
1.5. leader服务器收到半数以上的follower的ACK后，即认为可以发送commit
1.6. leader向所有的follower服务器发送commit消息。

zookeeper采用ZAB协议的核心就是只要有一台服务器提交了proposal，就要确保所有的服务器最终都能正确提交proposal。这也是CAP/BASE最终实现一致性的一个体现。
leader服务器与每个follower之间都有一个单独的队列进行收发消息，使用队列消息可以做到异步解耦。leader和follower之间只要往队列中发送了消息即可。如果使用同步方式容易引起阻塞。性能上要下降很多。

ZAB协议中Leader等待follower的ACK反馈是指”只要半数以上的follower成功反馈即可，不需要收到全部follower反馈，这样是无法处理数据一致性的问题的。因此，ZAB添加了崩溃回复模式来解决这个问题。

崩溃恢复模式

zookeeper集群中为保证任何所有进程能够有序的顺序执行，只能是leader服务器接受写请求，即使是follower服务器接受到客户端的请求，也会转发到leader服务器进行处理。
如果leader服务器发生崩溃，则zab协议要求zookeeper集群进行崩溃恢复和leader服务器选举。
ZAB协议崩溃恢复要求满足如下2个要求：
3.1 确保已经被leader提交的proposal必须最终被所有的follower服务器提交。
3.2 确保丢弃已经被leader出的但是没有被提交的proposal。
根据上述要求，新选举出来的leader不能包含未提交的proposal，即新选举的leader必须都是已经提交了的proposal的follower服务器节点。同时，新选举的leader节点中含有最高的ZXID。这样做的好处就是可以避免了leader服务器检查proposal的提交和丢弃工作。
leader服务器发生崩溃时分为如下场景：
4.1. leader在提出proposal时未提交之前崩溃，则经过崩溃恢复之后，新选举的leader一定不能是刚才的leader。因为这个leader存在未提交的proposal。
4.2. leader在发送commit消息之后，崩溃。即消息已经发送到队列中。经过崩溃恢复之后，参与选举的follower服务器(刚才崩溃的leader有可能已经恢复运行，也属于follower节点范畴)中有的节点已经是消费了队列中所有的commit消息。即该follower节点将会被选举为最新的leader。剩下动作就是数据同步过程。

数据同步

在zookeeper集群中新的leader选举成功之后，leader会将自身的提交的最大proposal的事物ZXID发送给其他的follower节点。follower节点会根据leader的消息进行回退或者是数据同步操作。最终目的要保证集群中所有节点的数据副本保持一致。
数据同步完之后，zookeeper集群如何保证新选举的leader分配的ZXID是全局唯一呢？这个就要从ZXID的设计谈起。
ZXID是一个长度64位的数字，其中低32位是按照数字递增，即每次客户端发起一个proposal,低32位的数字简单加1。高32位是leader周期的epoch编号，每当选举出一个新的leader时，新的leader就从本地事物日志中取出ZXID,然后解析出高32位的epoch编号，进行加1，再将低32位的全部设置为0。这样就保证了每次新选举的leader后，保证了ZXID的唯一性而且是保证递增的。

Zookeeper设计目标

zookeeper作为当今最流行的分布式系统应用协调框架，采用zab协议的最大目标就是建立一个高可用可扩展的分布式数据主备系统。即在任何时刻只要leader发生宕机，都能保证分布式系统数据的可靠性和最终一致性。

深刻理解ZAB协议，才能更好的理解zookeeper对于分布式系统建设的重要性。以及为什么采用zookeeper就能保证分布式系统中数据最终一致性，服务的高可用性。

参考书籍:

从Paxos到Zookeeper 分布式一致性原理与实践

coderlong

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
ZAB协议对分布式一致性的保证

在前面，我讲了Raft协议在分布式环境下的作用，这篇讲解ZK的ZAB协议算法。谈到ZAB协议，不得不提的是Paxos算法，可是Paxos就如所有的书和博客里面说的那样，的确让人很难理解，我尝试看了很多相关的资料，对他的概念还是一知半解，raft算是对Paxos的一种可理解的实现。Zab协议的全称是 Zookeeper Atomic Broadcast （Zookeeper原子广播）。Zo...
复制链接

扫一扫