0. 论文链接:raft
1. 三个角色:Follower、Candidate、Leader。
一些名词,term(任期编号、总是递增)
选举超时时间:follower waits until becoming a candidate(跟随都等待成为一个候选者的时间)。The election timeout is randomized to be between 150ms and 300ms。超时时间结束后,跟随都将更变自己的角色为候选者,并发起新一轮选举(新的term,选举自己为leader)。
2. 在等待投票(选举)阶段,系统初始化或者Leader心跳超时,都会进入这个阶段。此时角色为Candidate,如果有一个Candidate声称其为Leader,如果该Candidate的term大于等于自身的term,那么就认为该Candidate是一个合法的Leader,自身转为Follower状态。
3. Candidate经过一个随机超时时间后,向所有其他Candidate发超RPC投票,要求选举自己为Leader,并同时投自己一票。
4. 当Candidate接收到一个选举RPC请求后,请求中所带的term比自身的term要大时,返回同意。并拒绝后续相同地term选举RPC请求。同时该Candidate会重置其自身的超时选举时间。
5. 当获得集群中的多数票后,Candidate将成为Leader。
6. 当多个Follower同时变为Candidate时,可能一直无法选出Leader。通过使用'随机选举超时'机制来保证多个Follower不会同一时刻成为Candidate,或者通过随机超时时间使得多个Candidate在不同时间进入下一轮的选举。当多个Candidate同时发起投票RPC并且都没有获得多数支持时,那么当前轮就没有leader,等待下一次选举超时。
7. 一个Leader会持续向Follower发送心跳,使得Follower的选举超时时间重置,这样Follower就不会成为一个Candidate,也就不会发起新一轮投票了。
未完待继...