简介
- ZAB(Zookeeper Atomic BroadCast)协议。
- 为zk专门设计的支持崩溃恢复的原子广播协议。
- zk使用zab协议在主备模式的架构中保持集群各副本数据的一致性。
崩溃恢复模式
条件
- 服务框架重启。
- Leader异常:网络中断、崩溃退出、重启。
目的
- 选取新Leader。
- Follower和Leader数据同步。
- 已经被Leader提交的Proposal能够被所有Follower提交。
- 跳过已经被丢弃事务的Proposal。
步骤
ZXID:事务ID,共64位,32位epoch标识leader周期,32位标识事务编号
- Leader选举。Leader选举为提出Proposal中最大ZXID的机器,对epoch+1。
- Leader以Proposal紧接着Commit消息的形式同步数据给Follower。
- 包含上一个leader周期未提交Proposal的Follower启动时,会被Leader要求回退到过半机器提交的最新Proposal。
消息广播模式
条件
- 过半Follower完成和Leader的状态同步。
目的
- 主备数据一致性。
- 两阶段提交移除回滚逻辑。
- 基于FIFO的TCP,保证消息接收和发送的顺序性。
步骤
- Leader为每个事务请求生成Proposal,分配ZXID。
- Leader广播Proposal。
- Follower事务日志落盘,返回Ack。
- Leader收到超过半数Follower的Ack后,广播Commit消息通知提交。
- Leader自身提交。
- Follower收到Commit消息之后提交。
和Paxos的关系
- Zab是multi-Paxos的变体。
相同
- Leader协调多个Follower。
- Leader等待超过半数Follower反馈后提交。
- 每个Proposal包含一个epoch值,标识当前的Leader周期。
不同
- 目的不同。
- ZAB:构建高可用分布式主备系统。
- Paxos:构建分布式一致性状态机系统。