网络分区是raft协议需要解决的异常问题之一,假设有A,B,C,D,E五个节点。假设A和E网络不通,但是他们和B,C,D都是通的如下图:
假设某一时刻leader是A节点,E在超时没有收到心跳后,把term+1,发起leader选举,如果这段时间B,C,D没有写入更新的日志,由于E的term更大,就会被选为leader,A在后面的RPC中因为自己的term较小也会被降为follower。
但是由于A成为follower之后和E之间网络不通也会按照上面E的方式发起选举成为leader。A和E反复成为leader。
Raft个给出的解决方法是使用preVote。想要成为Candidate要先进行preVote投票,在preVote投票时follower节点可以查看自己和leader之间的租约有效期如果租约还在有效期内就不投票或者follower检查当前leader是否还存在,如果还存在不投票。
上面的方法有个前提就是这段时间内没有新的日志写下来,如果有日志变化时preVote阶段各个follower还会比较自身和preVote发起方的日志,如果发起方的日志落后于自身也是不投票的。
经过上面的处理可以避免掉网络分区引起的leader反复切换问题