Zookeeper启动流程
zookeeper服务器有4个状态:
- LOOKING:寻找Leader
- FOLLOWING:作为Follower
- LEADING:作为Leader
- OBSERVING:作为Observer
集群版zk服务器启动状态:
- 初始化Leader选举,这期间包括给自己投一票
- 注册JMX服务
- 检测当前服务器的状态,初始化一般时LOOKING
- Leader选举过程
- 同步状态
- 向外界提供服务
Leader选举方法
几个概念:
- vote_sid:接收到投票的服务器id
- self_sid:自己服务器的id
- vote_zxid:接收到投票的服务器zxid
- self_zxid:自己的zxid
选举过程:
- 每个服务器初始化先给自己投一票,并把投票向集群广播
- 接收其它服务器的投票,4种情况:
- vote_zxid > self_zxid:认可投票,并转发结果
- vote_zxid < self_zxid:不认可投票,保持不变
- vote_zixd = self_zixd && vote_sid > self_zxid:认可投票,并转发结果
- voite_zixd = self_zxid && vote_sid < self_zxid:保持不变
- 经过这一轮投票,获得半数以上的服务器成为leader,并广播状态,其余的是follower
之后,所有的Follower,向leader注册,主要是把自己的信息发给leader,包括当前的sid和最新的zxid。
leader获取信息后,计算epoch
,如果follower的epoch
更大,则更新epoch = epoch + 1
。计算完成后,向qita机器发送,接收到ACK之后,就可以进行数据同步了。只要有半数以上的机器收到ACK,则整个集群就启动了。
对于正常集群,如果有新的机器加入,则使用现有的Leader,如果现有的Leader挂掉,则由一台服务器发起投票,走上述的流程,重新进行leader选举。
zookeeper各个角色的作用
- Leader:事务的唯一调度和处理者,保证集群事务的顺序性;集群内部各个服务器的调度者
- Follower:提供读取数据的功能;参与选举Leader投票;如果收到事务请求,则转发给Leader,之后把Leader的处理结果发给客户端
- Observer:只读请求,不参与事务处理,不参与投票