这几天详细了解了下zookeeper的选举规则,总的说来zookeeper就是三种工作状态:崩溃恢复,消息广播,数据同步。崩溃恢复就是zookeeper互相选举leader的过程,消息广播就是提交proposal并且执行proposal的过程,而数据同步则是在崩溃恢复后从leader进行数据同步。这里总结一下zookeeper的选举过程,主要分为四个步骤
1.大家互相投票,选票格式:epoch,zxid,serverid,其中,epoch为选举轮次,zxid为上一轮proposal的ID,serverid为服务器配置的ID
2.按照选票格式,先判断epoch,再判断zxid,再判断serverid,如果接收到的请求中某一个请求符合leader条件,则记录下该leader的epoch,zxid,serverid,同时向其他server发送这个leader请求
3.如果接收到请求都不会更新本地leader(大家都公认他就是leader了),等待200ms,这时候还要判断一下这个大家公认的leader是否已经处于leading状态,如果已经处于则直接同步数据了
4.leader和follower各自进入自己的状态,同步数据,开始接收外界请求,这时候选举工作已经完成了