Raft协议--Leader选举--02

勤径苦舟

已于 2022-10-23 22:32:35 修改

阅读量840

点赞数

分类专栏：协议文章标签：网络服务器运维

于 2021-04-06 11:50:53 首次发布

本文链接：https://blog.csdn.net/zhou920786312/article/details/115457758

版权

协议专栏收录该内容

9 篇文章 2 订阅

订阅专栏

本文详细介绍了Raft一致性算法中的Leader选举过程。在初始状态下，节点作为Follower等待心跳，超时后转换为Candidate并发起选举。节点通过比较任期号和获取多数选票来确定新Leader。当Leader故障时，其他节点会触发新选举。选举限制确保当选Leader包含所有已提交日志。关键参数如RTT、Heartbeat Timeout和Election Timeout影响选举成功率。

摘要由CSDN通过智能技术生成

Raft协议–Leader选举–02

1、Leader选举的过程

Raft 使用心跳(heartbeat)触发Leader选举。
1. 当服务器启动时，初始化为Follower。
2. Leader向所有Followers周期性发送heartbeat。
3. 如果Follower在选举超时时间内没有收到Leader的heartbeat，就会等待一段随机的时间后发起一次Leader选举。
  1. 每一个follower都有一个时钟，是一个随机的值，表示的是follower等待成为leader的时间，谁的时钟先跑完，则发起leader选举。
Follower发起leader选举。
1. Follower将其当前term加1然后转换为Candidate。
2. 它首先给自己投票并且给集群中的其他服务器发送 RequestVote RPC。
Candidate选举结果
1. 赢得了多数的选票，成功选举为Leader；
  1. 如果获取的总结点一半的选票，直接成为Leader，可以不和其他Candidate对比。
2. 收到了Leader的消息，表示有其它服务器已经抢先当选了Leader；
3. 没有服务器赢得多数的选票，Leader选举失败，等待选举时间超时后发起下一次选举。

1.1、初始状态

初始状态下，集群中全部节点都是跟随者的状态。

以下图所示，有三个节点(Node) a、b、c，任期(Term)都为 0。

在这里插入图片描述

Raft算法实现了随机超时时间的特性

每一个节点等待领导者节点心跳信息的超时时间间隔是随机的。举例如下
	1. A节点等待超时的时间间隔150 ms
		1. a节点最早由于没有等到领导者的心跳信息，发生超时。
	2. B节点200 ms
	3. C节点300 ms。

以下图所示，三个节点的超时计时器开始运行

在这里插入图片描述

1.2、发起投票

当A节点的超时时间到了后，A节点成为候选者

1. 增加自己的任期编号，Term 值从 0 更新为 1
2. 给自己投了一票。

当前各个节点情况

Node A：Term = 1, Vote Count = 1。
Node B：Term = 0。
Node C：Term = 0。

在这里插入图片描述

1.3、成为领导者的简化步骤

在这里插入图片描述

1.3.1、第一步：节点A成为候选者后，向其他节点发送RPC信息，请它们选举自己为领导者。

1.3.2、第二步：节点B和节点C

接收到节点A发送的请求投票信息后，在编号为1的这届任期内，还没有进行过投票，就把选票投给节点A。
增加自己的任期编号。

1.3.3、第三步：节点A收到3次投票，得到了大多数节点的投票

从候选者成为本届任期内的新的领导者。

1.3.4、第四步：节点A作为领导者

固定的时间间隔给节点B和节点C发送心跳信息
1. 告诉节点B和C，不要发起新的选举。

1.3.5、第五步：节点B和节点C发送响应信息给节点A

告诉节点A我是正常的。

2、raft算法的注意点

1. 自动增加
	1. 跟随者在等待领导者心跳信息超时后，推荐自己为候选人，会增加自己的任期号，举例如下
		1. 节点 A 任期为 0，推举自己为候选人时，任期编号增加为 1。
	
2. 更新为较大值
	1. 当节点发现自己的任期编号比其他节点小时，会更新到较大的编号值。举例如下
		1. 比如节点 A 的任期为 1，请求投票时，投票消息中包含了节点 A 的任期编号 1，节点 B 收到消息后，会将自己的任期编号更新为 1(0比1小)。
	
3. 恢复为跟随者：
	1. 如果一个候选人或者领导者，发现自己的任期编号比其他节点小
		1. 它会立即恢复成跟随者状态。
	2. 这种场景出现在分区错误恢复后，任期为 3 的领导者受到任期编号为 4 的心跳消息，那么前者将立即恢复成跟随者状态。
	
4. 拒绝消息：
	1. 如果一个节点接收到较小的任期编号值的请求，那么它会直接拒绝这个请求，举例如下
		1. 任期编号为 6 的节点 A，收到任期编号为 5 的节点 B 的投票消息，那么节点 A 会拒绝这个消息。

6. 一个任期内，领导者一直都会领导者，直到自身出现问题(如宕机)，或者网络问题(延迟)，其他节点发起一轮新的选举。

7. 在一次选举中，每一个服务器节点最多会对一个任期编号投出一张选票，投完了就没了。

3、触发新的一轮选举

如果领导者节点出现故障，则会触发新的一轮选举。如下图所示，领导者节点 A 发生故障，节点 B 和节点 C 就会重新选举 Leader。

在这里插入图片描述


第一步 ：节点 A 发生故障，节点 B 和节点 C 没有收到领导者节点 A 的心跳信息，等待超时。

第二步：节点 C 先发生超时，节点 C 成为候选人。

第三步：节点 C 向节点 A 和 节点 B 发起请求投票信息。

第四步：节点 B 响应投票，将票投给了 C，而节点 A 因为发生故障了，无法响应 C 的投票请求。

第五步：节点 C 收到两票(大多数票数)，成为领导者。

第六步：节点 C 向节点 A 和 B 发送心跳信息，节点 B 响应心跳信息，节点 A 不响应心跳信息。

4、Leader选举的限制

能被选举成为Leader的节点，一定包含了所有已经提交的日志条目。
1. 在Raft协议中，所有的日志条目都只会从Leader节点往Follower节点写入，且Leader节点上的日志只会增加，绝对不会删除或者覆盖。
  1. 这意味着Leader节点必须包含所有已经提交的日志，即能被选举为Leader的节点一定需要包含所有的已经提交的日志。

5、影响 raft 选举成功率的几个时间参数

RTT(Round Trip Time)：网络延时
Heartbeat timeout：心跳间隔
1. 通常应该比 election timeout 小一个数量级，目的是让 leader 能够持续发送心跳来阻止 followers 触发选举
election timeout：Leader 与 followers 间通信超时触发选举的时间
MTBF(Meantime Between Failure)：
1. Servers 连续常规故障时间间隔
2. RTT << Heartbeat timeout < Election timeout(ET) << MTBF

勤径苦舟

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Raft协议--Leader选举--02

一、Leader选举的过程Raft 使用心跳(heartbeat)触发Leader选举。当服务器启动时，初始化为Follower。Leader向所有Followers周期性发送heartbeat。如果Follower在选举超时时间内没有收到Leader的heartbeat，就会等待一段随机的时间后发起一次Leader选举。每一个follower都有一个时钟，是一个随机的值，表示的是follower等待成为leader的时间，谁的时钟先跑完，则发起leader选举。Followe
复制链接

扫一扫