关于zxid
zxid也就是事务id,用来来标识事务其结构如下图所示:
- epoch:朝代,时代 。代表集群中当前leader统治阶段,也可以认为是leader的版本,如果发生了leader重新选举产生新的leader,epoch会自增1
- 自增id:代表当前时代事务id,只有上一个zxid的事务提交了,下一个zkid代表的事务才能被集群处理,保证了事务顺序一致性
写入过程中异常处理案例
案例1
如果一个leader自己刚把一个proposal写入本地磁盘日志,就宕机了,没来得及发送给全部的follower,具体逻辑是如何?
- leader宕机之后会重新选举leader,产生一个新leader
- 老leader恢复之后成为followeer,发现自己比新leader最近的proposal的epoch比新leader的epoch低,就会丢弃掉这条数据
案例2
背景:
- 5台机器,1leader + 4个follower
- 1个leader把proposal发送给4个follower,其中3个folower(过半)都收到了proposal返回ack了,第4个follower没收到proposal
- 此时leader执行commit之后自己挂了,commit没发送给其他的follower
提问:
假设重新选举之后第4台follower当新的leader?这条数据一定永久性丢失了?
回答:
- 第4台不可能选上leader,因为它最新的zid比其他的follower都小
- 其他follower某一台成为leader之后,如果发现自己有个proposal未提交,会重新向所有的follower发起proposal,只要过半follower都ack了,就会发送commit给所有follower