简单实现ZAB协议
1 Leader选举-快速选举
基本采用欺负算法,原则为选举出来LastZxid及Server Id最大的节点为Leader
a 何时确定Leader?
在选举的过程中对状态为Leading的节点都有可能被改变,既本轮举过程失败,开启下轮选举。
选举需要一个结束条件,否则有可能选举会陷入无休止的循环。这个结束条件定为发送或接受到{COMMIT,Leader}命令,选举进程结束,进入恢复流程。
下面是一幅选举过程状态图
2 恢复
Follower向Leader发送注册信息(恢复请求){LastZxid,LastCommitZxid}
Leader在规定时间内自检
Leader向各个注册过的Follower主动发送恢复数据
Leader监控恢复情况,如果超半数同步完成,Leader进入消息广播(同步)
a 怎么确定恢复点?
首先在整个恢复之前,Leader需要根据所有Follower发来的节点信息{LastZxid,LastCommitZxid}进行自检,
自检Leader的LastZxid是否是合法数据,等到Leader确认完自身最后一条记录后,开始向各个Follower发送对应
恢复命令,如:
{TRUNC,Zxid}
{DIFF,Data}
{SNAP,Data}
这儿最重要的就是要在恢复之前,Leader执行一次自检,很多异常情况会导致Leader的LastZxid其实是上次遗留的脏数据。
3 同步
原子广播, 进入正式的二段式提交。同步一条消息流程如下
a Leader是否对客户端请求加入缓冲?可以考虑。
b Follower是否对消息持久化采用缓冲?暂不缓冲。
c Commit完成后,LastCommitZxid持久化是否采用缓冲?暂不缓冲
a中需要确定一个临界点,即什么时候认为Leader可用于消息同步--》等待超过半数Follower完成恢复后
b、c中 等待基本功能完成后再优化,对写磁盘加缓冲会提高效率,但存在数据丢失风险。