第一次启动
(1)服务器1启动,发起一次选举。服务器1投自己一票。此时服务器1票数一票,不够半数以上(3票),选举无法完成,服务器1状态保持为LOOKING。
(2)服务器2启动,再发起一次选举。服务器1和2分别投自己一票并交换选票信息;此时服务器1发现服务器2的myid比自己目前投票选举的(服务器1)大,更改选票为推举服务器2。此时服务器1票数0票,服务器2票数2票,没有半数以上结果,选举无法完成,服务器1、2状态保持LOOKING。
(3)服务器3启动,发起一次选举。此时服务器1和2都会更改选票为服务器3。此次投票结果:服务器1为0票,服务器2为0票,服务器3为3票。此时服务器3的票数已经超过半数,服务器3当选Leader。服务器1、2更改状态为FOLLOWING,服务器3更改状态为LEADING。
(4)服务器4启动,发起一次选举。此时服务器1、2、3已经不是LOOKING状态,不会更改选票信息。交换选票信息结果:服务器3为3票,服务器4为1票。此时服务器4服从多数,更改选票信息为服务器3,并更改状态为FOLLOWING。
(5)服务器5启动与服务器4一样。
非第一次启动
(1)当zookeeper集群中的一台服务器出现以下两种情况之一时,就会开始进入leader选举:
- 服务器初始化启动。
- 服务器运行期间无法和leader保持连接。
(2)当一台机器进入leader选举流程时,当前集群也可能会处于以下两种状态:
- 集群中本来就已经存在一个leader。在这种情况下,机器试图去选举leader时,会被告知当前服务器的leader信息,对于该机器来说,仅仅需要和leader机器建立连接,并进行状态同步即可。
- 集群中确实不存在leader。假设zookeeper由5台服务器组成,SID分别为1、2、3、4、5,ZXID分别为8、8、8、7、7,并且此时SID为3的服务器是leader,某一时刻,3和5服务器出现故障,因此开始进行leader选举。
SID为1、2、4的机器投票情况(epoch,ZXID,SID):(1,8,1)、(1,8,2)、(1,7,4)。
选举leader规则:
1)epoch大的直接胜出。
2)epoch相同,事务id大的胜出。
3)事务id相同,服务器id大的胜出。