Raft协议--Leader选举--02

本文详细介绍了Raft一致性算法中的Leader选举过程。在初始状态下,节点作为Follower等待心跳,超时后转换为Candidate并发起选举。节点通过比较任期号和获取多数选票来确定新Leader。当Leader故障时,其他节点会触发新选举。选举限制确保当选Leader包含所有已提交日志。关键参数如RTT、Heartbeat Timeout和Election Timeout影响选举成功率。
摘要由CSDN通过智能技术生成

Raft协议–Leader选举–02


1、Leader选举的过程

  1. Raft 使用心跳(heartbeat)触发Leader选举。
    1. 当服务器启动时,初始化为Follower。
    2. Leader向所有Followers周期性发送heartbeat。
    3. 如果Follower在选举超时时间内没有收到Leader的heartbeat,就会等待一段随机的时间后发起一次Leader选举。
      1. 每一个follower都有一个时钟,是一个随机的值,表示的是follower等待成为leader的时间,谁的时钟先跑完,则发起leader选举。
  2. Follower发起leader选举。
    1. Follower将其当前term加1然后转换为Candidate。
    2. 它首先给自己投票并且给集群中的其他服务器发送 RequestVote RPC。
  3. Candidate选举结果
    1. 赢得了多数的选票,成功选举为Leader;
      1. 如果获取的总结点一半的选票,直接成为Leader,可以不和其他Candidate对比。
    2. 收到了Leader的消息,表示有其它服务器已经抢先当选了Leader;
    3. 没有服务器赢得多数的选票,Leader选举失败,等待选举时间超时后发起下一次选举。

1.1、初始状态

初始状态下,集群中全部节点都是跟随者的状态。

以下图所示,有三个节点(Node) a、b、c,任期(Term)都为 0。

在这里插入图片描述

Raft算法实现了随机超时时间的特性

每一个节点等待领导者节点心跳信息的超时时间间隔是随机的。举例如下
	1. A节点等待超时的时间间隔150 ms
		1. a节点最早由于没有等到领导者的心跳信息,发生超时。
	2. B节点200 ms
	3. C节点300 ms。

以下图所示,三个节点的超时计时器开始运行

在这里插入图片描述

1.2、发起投票

当A节点的超时时间到了后,A节点成为候选者

1. 增加自己的任期编号,Term 值从 0 更新为 1
2. 给自己投了一票。

当前各个节点情况

Node A:Term = 1, Vote Count = 1。
Node B:Term = 0。
Node C:Term = 0。

在这里插入图片描述

1.3、成为领导者的简化步骤

在这里插入图片描述

1.3.1、第一步:节点A成为候选者后,向其他节点发送RPC信息,请它们选举自己为领导者。

1.3.2、第二步:节点B和节点C

  1. 接收到节点A发送的请求投票信息后,在编号为1的这届任期内,还没有进行过投票,就把选票投给节点A。
  2. 增加自己的任期编号。

1.3.3、第三步: 节点A收到3次投票,得到了大多数节点的投票

  1. 从候选者成为本届任期内的新的领导者。

1.3.4、第四步:节点A作为领导者

  1. 固定的时间间隔给节点B和节点C发送心跳信息
    1. 告诉节点B和C,不要发起新的选举。

1.3.5、第五步:节点B和节点C发送响应信息给节点A

  1. 告诉节点A我是正常的。

2、raft算法的注意点

1. 自动增加
	1. 跟随者在等待领导者心跳信息超时后,推荐自己为候选人,会增加自己的任期号,举例如下
		1. 节点 A 任期为 0,推举自己为候选人时,任期编号增加为 1。
	
2. 更新为较大值
	1. 当节点发现自己的任期编号比其他节点小时,会更新到较大的编号值。举例如下
		1. 比如节点 A 的任期为 1,请求投票时,投票消息中包含了节点 A 的任期编号 1,节点 B 收到消息后,会将自己的任期编号更新为 1(0比1小)。
	
3. 恢复为跟随者:
	1. 如果一个候选人或者领导者,发现自己的任期编号比其他节点小
		1. 它会立即恢复成跟随者状态。
	2. 这种场景出现在分区错误恢复后,任期为 3 的领导者受到任期编号为 4 的心跳消息,那么前者将立即恢复成跟随者状态。
	
4. 拒绝消息:
	1. 如果一个节点接收到较小的任期编号值的请求,那么它会直接拒绝这个请求,举例如下
		1. 任期编号为 6 的节点 A,收到任期编号为 5 的节点 B 的投票消息,那么节点 A 会拒绝这个消息。

6. 一个任期内,领导者一直都会领导者,直到自身出现问题(如宕机),或者网络问题(延迟),其他节点发起一轮新的选举。

7. 在一次选举中,每一个服务器节点最多会对一个任期编号投出一张选票,投完了就没了。

	 

3、触发新的一轮选举

如果领导者节点出现故障,则会触发新的一轮选举。如下图所示,领导者节点 A 发生故障,节点 B 和 节点 C 就会重新选举 Leader。

在这里插入图片描述


第一步 :节点 A 发生故障,节点 B 和节点 C 没有收到领导者节点 A 的心跳信息,等待超时。

第二步:节点 C 先发生超时,节点 C 成为候选人。

第三步:节点 C 向节点 A 和 节点 B 发起请求投票信息。

第四步:节点 B 响应投票,将票投给了 C,而节点 A 因为发生故障了,无法响应 C 的投票请求。

第五步:节点 C 收到两票(大多数票数),成为领导者。

第六步:节点 C 向节点 A 和 B 发送心跳信息,节点 B 响应心跳信息,节点 A 不响应心跳信息。

4、Leader选举的限制

  1. 能被选举成为Leader的节点,一定包含了所有已经提交的日志条目。
    1. 在Raft协议中,所有的日志条目都只会从Leader节点往Follower节点写入,且Leader节点上的日志只会增加,绝对不会删除或者覆盖。
      1. 这意味着Leader节点必须包含所有已经提交的日志,即能被选举为Leader的节点一定需要包含所有的已经提交的日志。

5、影响 raft 选举成功率的几个时间参数

  1. RTT(Round Trip Time):网络延时
  2. Heartbeat timeout:心跳间隔
    1. 通常应该比 election timeout 小一个数量级,目的是让 leader 能够持续发送心跳来阻止 followers 触发选举
  3. election timeout:Leader 与 followers 间通信超时触发选举的时间
  4. MTBF(Meantime Between Failure):
    1. Servers 连续常规故障时间间隔
    2. RTT << Heartbeat timeout < Election timeout(ET) << MTBF
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值