分布式 - Raft选举

最新推荐文章于 2024-03-13 11:26:19 发布

AttackingRookie

最新推荐文章于 2024-03-13 11:26:19 发布

阅读量2.1k

点赞数

分类专栏： # 八股文 - 分布式文章标签： raft

本文链接：https://blog.csdn.net/qq_39552758/article/details/124293277

版权

八股文 - 分布式专栏收录该内容

3 篇文章 0 订阅

订阅专栏

本文深入解析分布式系统中的Raft算法，探讨时序性、并发性和一致性问题，重点讲解了Raft角色（跟随者、候选人、领导者）、选举过程及关键机制，包括任期、心跳信息和随机超时等，展示了如何通过这些机制实现高效一致的领导决策。

摘要由CSDN通过智能技术生成

背景

分布式系统的挑战

时序性：运行在不同网络下的机器中的进程如何判断一些事件的发生顺序。
并发性：运行在不同网络下的机器中的进程如何共享资源，而互不打扰。比如访问共同的数据库。
健壮性：应对网络的不稳定以及硬件的不稳定。
一致性：如何保障无论访问哪个服务节点，都能获取相同的结果。

分布式共识

分布式系统中多个节点之间，彼此对某个状态达成一致结果的过程。

分布式共识的应用

逻辑时间的共识，来决定事件发生的顺序。
互斥性的共识，用于决定谁正拥有访问的资源。
协调者的共识，谁是当下的leader。

Raft 角色

跟随者（Follower）：普通群众，默默接收和来自领导者的消息，当领导者心跳信息超时的时候，就主动站出来，推荐自己当候选人。
候选人（Candidate）：候选人将向其他节点请求投票 RPC 消息，通知其他节点来投票，如果赢得了大多数投票选票，就晋升当领导者。
领导者（Leader）：霸道总裁，一切以我为准。处理写请求、管理日志复制和不断地发送心跳信息，通知其他节点“我是领导者，我还活着，你们不要”发起新的选举，不用找新领导来替代我。

如下图所示，分别用三种图代表跟随者、候选人和领导者。
在这里插入图片描述

Raft选举过程

演示案例
http://thesecretlivesofdata.com/raft/

1.初始状态

初始状态下，集群中所有节点都是跟随者的状态。如下图所示，有三个节点(Node) a、b、c，任期（Term）都为 0。
在这里插入图片描述
Raft 算法实现了随机超时时间的特性，每个节点等待领导者节点心跳信息的超时时间间隔是随机的（150ms - 300ms）。比如 A 节点等待超时的时间间隔 150 ms，B 节点 200 ms，C 节点 300 ms。那么 a 先超时，最先因为没有等到领导者的心跳信息，发生超时。如下图所示，三个节点的超时计时器开始运行。
在这里插入图片描述

2.发起投票

当 A 节点的超时时间到了后，A 节点成为候选者，并增加自己的任期编号，Term 值从 0 更新为 1，并给自己投了一票。

Node A：Term = 1, Vote Count = 1。
Node B：Term = 0。
Node C：Term = 0。

开始倒计时

在这里插入图片描述

A节点倒计时结束，给自己投票

在这里插入图片描述

3. 成为领导者的简化过程

我们来看下候选者如何成为领导者的。

节点 A 成为候选者后，向其他节点发送请求投票 RPC 信息，请它们选举自己为领导者。
节点 B 和节点 C 接收到节点 A 发送的请求投票信息后，在编号为 1 的这届任期内，还没有进行过投票，就把选票投给节点 A，并增加自己的任期编号。
节点 A 收到 3 次投票，得到了大多数节点（n/2+1)的投票，从候选者成为本届任期内的新的领导者。
节点 A 作为领导者，固定的时间间隔给节点 B 和节点 C 发送心跳信息，告诉节点 B 和 C，我是领导者，组织其他跟随者发起新的选举。
节点 B 和节点 C 发送响应信息给节点 A，告诉节点 A 我是正常的。

4.领导者的任期

英文单词是 term，领导者是有任期的。

自动增加：跟随者在等待领导者心跳信息超时后，推荐自己为候选人，会增加自己的任期号，如上图所示，节点 A 任期为 0，推举自己为候选人时，任期编号增加为 1。
更新为较大值：当节点发现自己的任期编号比其他节点小时，会更新到较大的编号值。比如节点 A 的任期为 1，请求投票，投票消息中包含了节点 A 的任期编号，且编号为 1，节点 B 收到消息后，会将自己的任期编号更新为 1。
恢复为跟随者：如果一个候选人或者领导者，发现自己的任期编号比其他节点小，那么它会立即恢复成跟随者状态。这种场景出现在分区错误恢复后，任期为 3 的领导者受到任期编号为 4 的心跳消息，那么前者将立即恢复成跟随者状态。
拒绝消息：如果一个节点接收到较小的任期编号值的请求，那么它会直接拒绝这个请求，比如任期编号为 6 的节点 A，收到任期编号为 5 的节点 B 的请求投票 RPC 消息，那么节点 A 会拒绝这个消息。
一个任期内，领导者一直都会领导者，直到自身出现问题（如宕机），或者网络问题（延迟），其他节点发起一轮新的选举。