一、Zookeeper选举机制
Zookeeper为了保证各节点协同工作,在工作时需要一个Leader角色,而Zookeeper默认采用FastLeaderElection算法,且投票数大于半数则胜出的机制,再介绍选举机制之前,首先了解选举涉及的相关概念。
1. 服务器ID(serverID)
这是在配置集群时设置的myid参数文件,且参数分别表示为服务器1、服务器2、服务器3,编号越大在FastLeaderElection中权重就越大。
2. 选举状态
在选举过程中,Zookeeper服务器有四种状态,它们分别为竞选状态(Looking)、随从状态(Following,同步leader状态,参与投票)、观察状态(Observing,同步leader状态,不参与投票)、领导者状态(Leading)。
3. 数据ID
是服务器中存放的最新数据版本号,该值越大则说明数据越新,在选举过程中数据越新权重越大。
4. 逻辑时钟
通俗来讲,逻辑时钟被称为投票次数,同一轮投票过程中逻辑时钟值是相同的,逻辑时钟起始值为0,每投完一次票,这个数据就会增加。然后,与接收到其它服务器返回的投票信息中的数值比较,根据不同的值做出不同的判断。如果某台机器宕机,那么这台机器不会参与投票,因此逻辑时钟也会比其他的低。
二、选举机制的类型。
Zookeeper选举机制有两种类型,分别为全新集群选举和非全新集群选举,下面分别对两种类型进行详细讲解。
1. 全新集群选举。
全新集群选举是新搭建起来的,没有数据ID和逻辑时钟的数据影响集群的选举。假设,目前有5台服务器,它们的编号分别是1-5,按编号一次启动Zookeeper服务,下面讲解全新集群选举的过程。
- 服务器1启动,首选会给自己投票;其次,发送投票信息,由于其它机器还没有启动,所以它无法接收到投票的反馈信息,因此服务器1的状态一直处于Looking状态。
- 服务器2启动,首先会给自己投票,其次,在集群中启动zookeeper服务的机器发起投票对比,这时它会与服务器1交换结果,由于服务器2的编号大,所以服务器2胜出,此时服务器1会将票投给服务器2,但此时服务器2的投票数并没有大于集群半数(2<5/2),所以量个服务器的状态依然是Looking状态。
- 服务器3启动,首先会给自己投票,其次,与之前启动的服务器1,2交换信息,由于服务器3的编号最大,所以服务器3胜出,那么服务器1、2会将票投给服务器3,此时投票数正好大于半数(3>5/2),所以服务器3称为领导者状态,服务器1、2称为追随者状态。
- 服务器4启动,首先,给自己投票,其次,与之前启动的服务器1,2,3交换信息,尽管服务器4的编号大,但是服务器3已经胜出。所以服务器4只能称为追随者状态。
- 服务器5启动,同服务器4一样,均成为追随者状态。
2. 非全新集群选举
对于正在运行的Zookeeper集群,一旦中途有服务器宕机,则需要重新选举时,选举的过程就需要引入服务器ID、数据ID和逻辑时钟。这是由于Zookeeper集群已经运行过一段时间,那么服务器中就会存在运行的数据。下面来讲解非全新集群选举的过程。
- 首先,统计逻辑时钟是否相同,逻辑时钟小,则说明途中可能存在宕机问题,因此数据不完整,那么该选举结果被忽略,重新投票选举。
- 其次,统一逻辑时钟后,对比数据ID值,数据ID反映数据的新旧程度,因此数据ID大的胜出。
- 如果逻辑时钟和数据ID都相同的情况下,那么比较服务器ID(编号),值大则胜出。
简单来讲,非全新集群选举时是优中选优,保证Leader是Zookeeper集群中数据最完整,最可靠的一台服务器。