ZooKeeper的ZAB协议？

喵呜刷题

已于 2023-08-31 09:51:31 修改

阅读量218

点赞数 2

分类专栏：分布式服务文章标签： java-zookeeper zookeeper 服务器面试

于 2022-07-27 10:31:27 首次发布

本文链接：https://blog.csdn.net/jjclove/article/details/124924089

版权

22 篇文章 0 订阅

订阅专栏

Zab（Zookeeper Atomic Broadcast）是为ZooKeeper协设计的崩溃恢复原子广播协议，它保证zookeeper集群数据的一致性和命令的全局有序性。

ZAB协议的两种基本模式：崩溃恢复模式和消息广播模式。

ZAB协议会让ZK集群进入崩溃恢复模式的情况如下：

ZAB协议进入恢复崩溃模式会做什么事情？

当Leader出现问题，则进入恢复模式并选举出新的Leader服务器。确保当Leader出现单点问题，在新选举出Leader后，保证数据一致性。当选举出新的Leader服务器，同时集群中已经有过半的机器与该Leader服务器完成状态同步（数据同步），退出崩溃恢复模式。进入消息广播模式。
- ZAB协议需要确保那些已经在Leader服务器上提交的事务最终被所有服务器都提交。
- ZAB协议需要确保丢弃那些只在Leader服务器上被提出的事务。
当新加入一台机器到集群中，如果此时集群已经存在一个Leader服务器在负责进行消息广播，那么新加入的服务器就会自觉地进入数据恢复模式。找到Leader服务器，并与其进行数据同步，然后进入消息广播模式，一起参与到消息广播流程中去。

在整个消息广播过程中，Leader服务器会为每一个事务请求处理步骤：

Leader服务器会为事务请求生成一个全局的的递增事务ID（即ZXID），保证每个消息的因果关系的顺序。
Leader服务器会为该事务生成对应的Proposal，进行广播。
Leader服务器会为每一个Follower服务器都各自分配一个单独的队列，让后将需要广播的事务Proposal依次放入这些队列中去，并根据FIFO策略进行消息发送。
每一个Follower服务器在接收到这个事务Proposal之后，首先以日志形式写入本地磁盘，并且成功写入后反馈给Leader服务器一个Ack响应
当Leader服务器接收超过半数的Follower的Ack响应，Leader自身也会完成对事务的提交。同时就会广播一个Commit消息给所有的Follower服务器以通知进行事务提交。每一个Follower服务器在接收到Commit消息后，也会完成对事务的提交。

旧Leader宕机后，选举新Leader中，旧的Leader重启后不可能再次成为这次选举的新Leader。
旧Leader宕机后，在剩下的Follower服务器选取新Leader的标准，一定是事务ID最大的那个Follower成为新Leader。（即数据同步最新的那台Follower服务器）
事务ID（ZXID）是64位的数字。其中低32位可以靠做是一个简单的单调递增的计数器，高32位则代表一个Leader从生到死的epoch编号。
新Leader选举出来，从事务proposal中分析出旧Leader的epoch编号，并递增1,作为新的事务ID的高32位，然后新事务ID的低32位从0位重新开始计数。
新Leader通过事务ID和所有的Follower机器上的事务ID进行对比，确保数据同步。保证数据在所有的Follower上与之达成同步。旧Leader上新被提出的事务被抛弃。当数据达到同步，才将Follower服务器加入可用的Follower服务器列表。然后开始消息广播。

喵呜面试助手：一站式解决面试问题，你可以搜索微信小程序 [喵呜面试助手] 或关注 [喵呜刷题] -> 面试助手 免费刷题。如有好的面试知识或技巧期待您的共享！

关注