写在前面:之前也是了解过大概,,,
例如五台机器
第一次启动:
- 服务器1启动,发起一次选举。服务器1投自己一票。此时服务器1有一票,不够半数,服务器保持为LOOKING
- 服务器2启动,再发起一次选举,服务器1和2分别投自己一票,并交换选票信息:此时服务器1发现服务器2的myid比自己的大,更改选票为服务器2。此时服务器1,1票。服务器2,2票,没有半数以上结果,选举无法成功。服务器1,2 保持LOOKING状态。
- 服务器3启动,发起一次选举,此时服务器1和2否更选票为服务器3,此次服务器1,零票。服务器2位零票。服务器3位三票。超过半数,服务器三当选为leader。服务器1,2更改状态为FOLLOWING,服务器3改为LEADING。
- 服务器4启动,发一次选举,此时服务器已经不是LOOKING状态,不会更改选信息。交换结果为服务器3票,服务器4,1票。少数服从多数,服务器4改为FOLLOWING。
- 服务器5也是一个过程。
非第一启动
当zk集群中的一台服务器出现以下两种情况之一时,就会开始进入Leader选举。
- 服务器初始化
- 服务器运行期间无法和Leader保持连接
当一台机器进入Leader选举流程时,当前集群也可能会处于以下两种状态
- 集群中本来就已经存在Leader
- 对于已经存在Leader,机器试图去选举Leader时,会被告知当前服务器的Leader信息,对于该机器来说,仅仅需要和Leader机器进行连接,并进行状态同步即可。
- 集群中趋势不存在Leader
- 假设zk由五台服务器组成,SID分别为1,2,3,4,5,ZXID分别为8,8,8,7,7并且SID为3的服务器是Leader。某一时刻,3和5服务器出现故障,一次进行Leader选举。
- SID为1,2,4,的机器投票情况(1,8,1), (1,8,2),(1,7,4) EPOCH,ZXID,SID
- 选举规则: 现根据 EPOCH,再根据ZXID,再根据SID。