在raft论文中,有且仅有三个数据需要持久化存储,分别是Log、currentTerm和votefor。对于Log我们能够很好的理解,因为其记录了应用程序的状态。当服务重启时,我们能通存储的Log重建应用程序的状态。那为什么必须存储currentTerm和votefor呢?还有为什么仅仅只需存储这三个数据?
一. 为什么必须存储currentTerm和votefor?
1.1为什么存储voterfor?
保证每个任期最多只有一个Leader!考虑如下一种场景:
因为在raft协议中每个任期内有且仅有一个Leader。现假设有几个raft节点在当前任期下投票给了raft节点A,并且raft A顺利成为了Leader。现故障系统被重启,重启后如果收到一个相同任期的raft节点B的投票请求,由于每个节点并没有记录其投票状态,那么这些节点就有可能投票给raft B,并使B成为Leader。此时,在同一个任期内就会存在两个Leader,与raft的要求不符。
故votefor需要被存储
1.2 为什么要存储currentTerm?
同样也是保证每个Index位置只会有一个Term! (也等价于每个任期内最多有一个Leader)。如下图所示,假设如下场景:
r1节点在index为2的位置为Leader任期为6、在index为3的位置为Leader任期为7,而r2节点和r3节点在这两个位置的任期应该跟r1是一致的。现假设r1崩溃了,r2和r3会尝试选举一个新的Leader。如果没有存储currentTerm,会出现什么情形呢?
假设现在r