raft选举算法
Nacos集群采用raft算法来实现
raft算法演示地址:http://thesecretlivesofdata.com/raft/
节点角色
Leader:负责接收客户端的请求,与Follower保持这heartBeat的联系;
Candidate:用于选举Leader的一种角色
Follower:负责响应来自Leader或者Candidate的请求,把请求到Follower的事务转发给Leader;
发生选举的时机
服务启动的时候
leader挂了的时候
选举过程
所有节点启动的时候,都是follower状态。 如果在一段时间内如果没有收到leader的心跳(可能是没有 leader,也可能是leader挂了),那么follower会变成Candidate。然后发起选举,选举之前,会增加 term,这个term和zookeeper中的epoch的道理是一样的。
- follower会投自己一票,并且给其他节点发送票据vote,等到其他节点回复
- 在这个过程中,可能出现几种情况
- 收到过半的票数通过,则成为leader
- 被告知其他节点已经成为leader,则自己切换为follower
- Election timeout发生则Term递增,则重新发起选举
- 在一个term任期中,单个节点最多只能投一票
集群状态:
第一种情况,有明确的leader(稳定状态),
leader会定期给所有follower节点发送消息,follower收到心跳后,重置倒计时器。所有节点内,维持一个数据结构(Term2,LeaderA),表示当前是第2任老大,老大是A
第二种情况,leader节点A挂了之后,
如果某个节点B自身的倒计时最先结束,则term+1,同时广播其他节点。其他节点发现B的Term3>自己的Term2,推举节点B作为leader(返回ok的信息,更新自身数据结构:Term3,LeaderB),节点B收到多数投票时(状态:Candidate->Leader),胜出之后,会给其他节点发心跳消息,节点B发现节点A的term不低于自己的term, 知道有已经有Leader了,于是转换成follower
由于每个节点中定时器(150ms ~ 300ms)的时间都是随机的,所以就不会多次 存在有多个Candidate同时发起投票的问题。