dbproxy选主原理

serve the people

已于 2023-03-01 16:43:24 修改

阅读量127

点赞数

分类专栏：中企知乎文章标签： java 分布式大数据 raft

于 2023-03-01 11:17:55 首次发布

本文链接：https://blog.csdn.net/xuanyuanjiaqi/article/details/129275542

版权

中企知乎专栏收录该内容

9 篇文章 0 订阅

订阅专栏

文章介绍了Sqlproxy如何基于Raft算法实现分布式一致性。Raft算法包括Follower、Candidate和Leader三种状态，通过心跳超时和随机选举超时时间避免多节点同时选举。每个任期只有一个领导者，多数节点的选票决定领导者。在领导者故障时，会触发新的选举。该算法确保了系统的稳定性和一致性。

摘要由CSDN通过智能技术生成

一、Sqlproxy遵循raft算法

Raft是实现分布式共识的一种算法，主要用来管理日志复制的一致性。

二、Raft的三种状态（角色）

Follower（群众）
被动接收Leader发送的请求。所有的节点刚开始的时候是处于Follower状态。
当领导者心跳信息超时的时候，就主动站出来，推荐自己当候选人。
Candidate（候选人）
由Follower向Leader转换的中间状态，候选人将向其他节点请求投票 RPC 消息，
通知其他节点来投票，如果赢得了大多数投票选票，就晋升当领导者。
Leader（领导）
处理写请求、管理日志复制和不断地发送心跳信息，通知其他节点“我是领导者，我还活着，你们不要”发起新的选举，不用找新领导来替代我。

三、基本概念

任期

英文单词是 term，领导者是有任期的。

自动增加
跟随者在等待领导者心跳信息超时后，推荐自己为候选人，会增加自己的任期号。节点 A 任期为 0，推举自己为候选人时，任期编号增加为 1。
更新为较大值
当节点发现自己的任期编号比其他节点小时，会更新到较大的编号值。比如节点 A 的任期为 1，请求投票，投票消息中包含了节点 A 的任期编号，且编号为 1，节点 B 收到消息后，会将自己的任期编号更新为 1。
恢复为跟随者
如果一个候选人或者领导者，发现自己的任期编号比其他节点小，那么它会立即恢复成跟随者状态。这种场景出现在分区错误恢复后，任期为 3 的领导者收到任期编号为 4 的心跳消息，那么前者将立即恢复成跟随者状态。
拒绝消息
如果一个节点接收到较小的任期编号值的请求，那么它会直接拒绝这个请求，比如任期编号为 6 的节点 A，收到任期编号为 5 的节点 B 的请求投票 RPC 消息，那么节点 A 会拒绝这个消息。

选举规则

一个任期内，领导者一直都会领导者，直到自身出现问题（如宕机），或者网络问题（延迟），其他节点发起一轮新的选举。

在一次选举中，每一个服务器节点最多会对一个任期编号投出一张选票，投完了就没了。

大多数

假设一个集群由 N 个节点组成，那么大多数就是至少 (N/2)+1。例如：3 个节点的集群，大多数就是 2。

心跳超时

为了防止多个节点同时发起投票，会给每个节点分配一个随机的选举超时时间。这个时间内，节点不能成为候选者，只能等到超时。

这种巧妙的设计，在大多数情况下只有一个服务器节点先发起选举，而不是同时发起选举，减少了因选票瓜分导致选举失败的情况。

四、初始选举

初始状态下，集群中所有节点都是跟随者的状态。
如下图所示，有三个节点(Node) a、b、c，任期（Term）都为 0。
成为候选者
Raft 算法实现了随机超时时间的特性，每个节点等待领导者节点心跳信息的超时时间间隔是随机的。
比如 A 节点等待超时的时间间隔 150 ms、B 节点 200 ms、C 节点 300 ms。那么 A 先超时，最先因为没有等到领导者的心跳信息，发生超时。
如下图所示，三个节点的超时计时器开始运行。
达到超时时间，成为候选者
当 A 节点的超时时间到了后，A 节点成为候选者，并增加自己的任期编号，Term 值从 0 更新为 1，并给自己投了一票。

Node A：Term = 1, Vote Count = 1。
Node B：Term = 0。
Node C：Term = 0。
投票
我们来看看候选者如何成为领导者的。
Leader 选举
第一步： 节点 A 成为候选者后，向其他节点发送请求投票 RPC 信息，请它们选举自己为领导者。