Zookeeper源码阅读(十六)选举之选票与集群校验

前言

前面一篇博客分析了ZAB的设计思想和包括快速选举在内的基本的过程,但在实际的Zookeeper工程中,为了达到ZAB的目标,还是有许多的内部的逻辑和机制,这一篇我们会先分析下为了实现选举Zookeeper所做的准备工作。

值得一提的是,Zookeeper的选举可以分为几步去讲,在写这几篇博客之前参考了不少资料,建议读者在完整过我这几篇博客之前可以先完整看一下参考一,这篇博客从整体上比较完整地叙述了真实的zookeeper工程里的选举过程。

状态

我们首先看一些基本的概念。

public enum ServerState {
    LOOKING, FOLLOWING, LEADING, OBSERVING;
}

可以看到,在Zookeeper中总共定义了4中状态:

LOOKING: 表示此台机器正在寻找leader,也就是说在选举状态;

FOLLOWING: 表示此台机器是follower;

LEADING: 表示此台机器是leader;

OBSERVING: 表示此台机器是observer。

选票

395447-20190619205552134-1749218141.png

Vote类是zk选举的实体类,通过上图可以看到Vote类中有几个核心的成员变量,这几个成员变量在后面具体的选举算法中起到了很关键的作用,Zookeeper的快速选举算法就是利用id, zxid和epoch来选举出新的leader。

先简单介绍下几个核心成员变量的含义:

id:选票推举的leader的SID(配置文件中配置的)

zxid:被推举的leader的事务ID

electionEpoch:逻辑时钟。是一个递增的数字,通过对比electionEpoch来判断server自己的Vote和其他Vote是否在同一个选举轮次中。每次进入一个新的选举轮次,electionEpoch都会+1。

peerEpoch:被推举的leader的epoch。

state:就是前面说的几种当前server的状态。

集群校验

ZK思考 这一篇最后有提出一个问题,也就是zookeeper集群出现了网络分区的情况,集群中的server会怎么处理呢?利用QuorumVerifier可以部分回答这个问题。

395447-20190619205608114-1514575498.png

可以看到,QuorumVerifier有两个实现类,但现在基本都默认使用QuorumMaj类,即投票是否满足超过一半的集群数目。可以简单分析下代码:

/**
 * This class implements a validator for majority quorums. The 
 * implementation is straightforward.
 *
 */
public class QuorumMaj implements QuorumVerifier {
    private static final Logger LOG = LoggerFactory.getLogger(QuorumMaj.class);
    
    int half;
    
    /**
     * Defines a majority to avoid computing it every time.
     * 
     * @param n number of servers
     */
    public QuorumMaj(int n){
        this.half = n/2;
    }
    
    /**
     * Returns weight of 1 by default.
     * 
     * @param id 
     */
    //这个方法在此类中是没有太多含义的,之所返回1是因为在totalOrderPredicate方法中有个判断,如果返回值==0会直接判小,这个在QuorumVerifier的另一个实现类中才会有返回0的可能性。
    public long getWeight(long id){
        return (long) 1;
    }
    
    /**
     * Verifies if a set is a majority.
     */
    //判断投票值是否超过了一半的server
    public boolean containsQuorum(HashSet<Long> set){
        return (set.size() > half);
    }
    
}
调用
/**
 * Termination predicate. Given a set of votes, determines if
 * have sufficient to declare the end of the election round.
 *
 *  @param votes    Set of votes
 *  @param l        Identifier of the vote received last
 *  @param zxid     zxid of the the vote received last
 */
protected boolean termPredicate(
        HashMap<Long, Vote> votes,
        Vote vote) {

    HashSet<Long> set = new HashSet<Long>();

    /*
     * First make the views consistent. Sometimes peers will have
     * different zxids for a server depending on timing.
     */
    for (Map.Entry<Long,Vote> entry : votes.entrySet()) {
        if (vote.equals(entry.getValue())){
            set.add(entry.getKey());
        }
    }

    return self.getQuorumVerifier().containsQuorum(set);//1
}

termPredicate是决定当前server收到的投票是否生效的方法,也就是之前提到的部分回答了网络分区的问题的地方。这里可以看到在1处当server收集了收到的所有的选票后,会和所有server个数作对比,如果没有超过一般的话依然无效。也就是说,即使出现了网络分区的情况,少部分的机器即使进入了选举状态也无法选出LEADER。

思考

值得注意的是,observer并不在校验的集群列表里。在QuorumPeerConfig类的读取配置的时候就已经把observer过滤了。

参考

https://www.cnblogs.com/leesf456/p/6107600.html

https://www.jianshu.com/p/e5ae0b6e07a2

转载于:https://www.cnblogs.com/gongcomeon/p/10817001.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值