步骤:
主节点选举
状态检测
触发选举条件
选举投票
1、状态检测
每个复制集成员都会在后台运行与复制集所有节点的心跳线程,当复制集成员心跳检测结果发生变化,比如某个节点挂了或者新增节点;或者超过4s没有执行状态检测过程时,触发状态检测。
状态检测过程会维护一个主节点的备用列表。
1.1可被选入主节点备用列表的条件
a. 是否看见复制集中有Majority在线。
b. 自身priority大于0。
c. 自身不为arbiter。
d. 自身opTime不能落后于最新节点10s以上。
e. 自身存储的集群程序按信息为最新
2、触发选举的条件
(1)主节点宕机
(2)主节点降级为从节点
主节点降级为从节点:
a. 集群中主节点存在。
b. "主节点的备用列表”中存在比当前的主节点priority更高的节点。
c. "主节点的备用列表”中priority最高的节点,其opTime要比其他所有节点最新的opTime落后10s以内。
d. 检测自身是否为主,若为主,且自身无法看见复制集的Majority在线,将自身降级为从。
e. 如果看不见集群中有主节点存在,检测自身是否在”主节点的备用列表”,若不在,打印log并退出此流程。
f. 若自身在”主节点的备用列表”中,开始判断自身可否向复制集中发送选举自身为主节点的通知,判断过程包含: 1> 自身是否可以看见复制集中的Majority在线。 2>自身是否在”主节点的备用列表”。
3、选举投票
3.1在主节点备选列表中的节点满足以下条件可以向其它节点发送"选举我为主节点”的投票申请:
a. 此线程拿到了线程锁。
b. 此节点没有被配置slaveDelay选项或者配置的slaveDelay为0。
c. 此节点没有被配置为arbiter
d.调用调用环境检测:
1> 当前时间小于steppedDown的结束冻结时间(为执行steppedDown时的时间+冻结设定时间,内部调用为60s)。
2> 自己的opTime不是所有节点最新的。
3> 若有节点opTime比自己新,
出现任何一条直接退出此流程。如果其他最新的节点最多与自己一样新,每有一个这样的节点,随机sleep一段时间,之后继续判断。a. 自己上线5分钟内且复制集中不是所有节点在线。b. 如无其他问题,尝试获取自己进行投票时的票数,在此过程中,会判断自己在30s内是否进行过投票,如进行过,直接退出整个过程。
发送之后,会接收来自所有节点的投票,若得票数小于等于一半,不将自己变为主节点,若超过一半,设置自己为主节点。
3.2 节点投票规则:
a. 若自身存储的复制集配置版本过低,不投票。
b. 若发起请求的节点存储的复制集配置版本过低,投反对票。
c. 如果自身所在的复制集没有发起投票的节点,投反对票。
d. 复制集中存在主节点,投反对票。可参与选举的节点中有priority高于请求为主的节点存在时,投反对票。
需要说一下的是,一个反对会将最终票数减10000,即在绝大多数情况下,只要有节点反对,请求的节点就不能成为主节点。
实际使用中总结为两点:一般情况下需要5s左右进行选主。如果新选举出的主节点立马挂掉,至少需要30s时间重新选主。