1、Zookeeper选举机制—第一次启动
1)服务器1启动,发起一次选举。服务器1投自己一票,此时服务器1票数一票,不够半数以上(3),选举无法完成,服务器1状态为LOOKING。
2)服务器2启动,发起一次选举。服务器1、2分别投自己一票,此时服务器1发现服务器2的myid比自己大,投给服务器2,服务器2两票,服务器1零票。服务器2的票数还是不够半数以上(3),选举无法完成,服务器1、2状态为LOOKING。
3)服务器3启动,发起一次选举,此时服务器1和服务器2都会更改选票为服务器3,此次投票结果为:服务器1零票、服务器2零票、服务器3三票,服务器3的票数已经超过半数,当选为Leader,其余服务器为Following,服务器3的状态更改为LEADING。
4)服务器4启动,发起一次选举,此时服务器1,2,3已经不是LOOKING状态,不会更改选票信息。此时服务器4服从多数,更改选票信息为服务器3,并更改状态为Following。
2、Zookeeper选举机制—非第一次启动选举机制
1)当Zookeeper集群中的一台服务器出现以下两种情况之一时,就会开始进入Leader选举:
·服务器初始化启动
·服务器运行期间无法和Leader保持连接
2)而当一台机器进入Leader选举流程时,当前集群也可能会处于以下两种状态。
·集群中本来已经存在一个Leader
·对于集群已经存在Leader,机器试图去选举Leader时,会被告知当前服务器的Leader信息,对于该机器来说,只需要和Leader机器建立连接,并进行状态同步即可。
·集群中确 实不存在Leader
·假设ZooKeeper由5台服务器组成,SID分别为1、2、3、4、5,ZXID分别为8、8、8、7、7,并且此时SID为3的服务器是Leader。某一时刻, 3和5服务器出现故障,因此开始进行Leader选举。
(EPOCH,ZXID,SID ) (EPOCH,ZXID,SID ) (EPOCH,ZXID,SID )
SID为1、2、4的机器投票情况: (1,8,1) (1,8,2) (1,7,4)
选举Leader规则: ①EPOCH大的直接胜出 ②EPOCH相同,事务id大的胜出 ③事务id相同,服务器id大的胜出
SID:服务器ID。用来唯一标识一台 ZooKeeper集群中的机器,每台机器不能重 复,和myid一致。
ZXID:事务ID。ZXID是一个事务ID,用来 标识一次服务器状态的变更。在某一时刻, 集群中的每台机器的ZXID值不一定完全一 致,这和ZooKeeper服务器对于客户端“更 新请求”的处理逻辑有关。
Epoch:每个Leader任期的代号。没有 Leader时同一轮投票过程中的逻辑时钟值是 相同的。每投完一次票这个数据就会增加