一. 问题背景
在raft协议中,Leader使所有的follower的log与其保持一致,出现不一致的情况时,Leader就会改动follower的日志。其实现保持一致原理为:
每个Leader会为每个follower维护一个nextIndex,其初始值为每个新任Leader的最后一条日志的下一条日志Index。并且,Leader向follower发现的广播消息中,包含了一prevLogIndex、prevLogTerm,并且preLogIndex = nextIndex -1、preLogTerm = log[preLogIndex].Term。当Leader发送过去的preLogIndex、prevLogTerm与follower对应位置log的Index和Term不匹配时,follower就会返回一个false告知Leader此处log不一致。
当Leader收到follewer返回的false时,Leader会回退其nextIndex,再次向follower发送广播直至收到来自follower表示目前位置log一致的消息才会停止回退。然后Leader会删除follower此位置后的所有log,并将Leader的log复制给follower。
二. 逐步回退的性能问题
对于回退,最简便的方式为如下代码的逐步回退,即每收到follower传回的false,nextIndex便回退一位:
rf.nextIndex[id] -= 1
if rf.nextIndex[id] < 1 {
rf.nextIndex[id] = 1
}
逐步回退在多数时候是可正常工作的,但是如果我们有多个follower断开网络连接且反复多次时,foll