dbproxy选主原理

文章介绍了Sqlproxy如何基于Raft算法实现分布式一致性。Raft算法包括Follower、Candidate和Leader三种状态,通过心跳超时和随机选举超时时间避免多节点同时选举。每个任期只有一个领导者,多数节点的选票决定领导者。在领导者故障时,会触发新的选举。该算法确保了系统的稳定性和一致性。
摘要由CSDN通过智能技术生成

一、Sqlproxy遵循raft算法

Raft是实现分布式共识的一种算法,主要用来管理日志复制的一致性。

二、Raft的三种状态(角色)

  • Follower(群众)
    被动接收Leader发送的请求。所有的节点刚开始的时候是处于Follower状态。
    当领导者心跳信息超时的时候,就主动站出来,推荐自己当候选人。

  • Candidate(候选人)
    由Follower向Leader转换的中间状态,候选人将向其他节点请求投票 RPC 消息,
    通知其他节点来投票,如果赢得了大多数投票选票,就晋升当领导者。

  • Leader(领导)
    处理写请求、管理日志复制和不断地发送心跳信息,通知其他节点“我是领导者,我还活着,你们不要”发起新的选举,不用找新领导来替代我。

三、基本概念

任期

英文单词是 term,领导者是有任期的。

  • 自动增加
    跟随者在等待领导者心跳信息超时后,推荐自己为候选人,会增加自己的任期号。节点 A 任期为 0,推举自己为候选人时,任期编号增加为 1。
  • 更新为较大值
    当节点发现自己的任期编号比其他节点小时,会更新到较大的编号值。比如节点 A 的任期为 1,请求投票,投票消息中包含了节点 A 的任期编号,且编号为 1,节点 B 收到消息后,会将自己的任期编号更新为 1。
  • 恢复为跟随者
    如果一个候选人或者领导者,发现自己的任期编号比其他节点小,那么它会立即恢复成跟随者状态。这种场景出现在分区错误恢复后,任期为 3 的领导者收到任期编号为 4 的心跳消息,那么前者将立即恢复成跟随者状态。
  • 拒绝消息
    如果一个节点接收到较小的任期编号值的请求,那么它会直接拒绝这个请求,比如任期编号为 6 的节点 A,收到任期编号为 5 的节点 B 的请求投票 RPC 消息,那么节点 A 会拒绝这个消息。

选举规则

一个任期内,领导者一直都会领导者,直到自身出现问题(如宕机),或者网络问题(延迟),其他节点发起一轮新的选举。

在一次选举中,每一个服务器节点最多会对一个任期编号投出一张选票,投完了就没了。

大多数

假设一个集群由 N 个节点组成,那么大多数就是至少 (N/2)+1。例如:3 个节点的集群,大多数就是 2。

心跳超时

为了防止多个节点同时发起投票,会给每个节点分配一个随机的选举超时时间。这个时间内,节点不能成为候选者,只能等到超时。

这种巧妙的设计,在大多数情况下只有一个服务器节点先发起选举,而不是同时发起选举,减少了因选票瓜分导致选举失败的情况。

四、初始选举

  • 初始状态下,集群中所有节点都是跟随者的状态。
    如下图所示,有三个节点(Node) a、b、c,任期(Term)都为 0。
    在这里插入图片描述

  • 成为候选者
    Raft 算法实现了随机超时时间的特性,每个节点等待领导者节点心跳信息的超时时间间隔是随机的。
    比如 A 节点等待超时的时间间隔 150 ms、B 节点 200 ms、C 节点 300 ms。那么 A 先超时,最先因为没有等到领导者的心跳信息,发生超时。
    如下图所示,三个节点的超时计时器开始运行。

  • 达到超时时间,成为候选者
    当 A 节点的超时时间到了后,A 节点成为候选者,并增加自己的任期编号,Term 值从 0 更新为 1,并给自己投了一票。

    Node A:Term = 1, Vote Count = 1。
    Node B:Term = 0。
    Node C:Term = 0。

  • 投票
    我们来看看候选者如何成为领导者的。
    在这里插入图片描述

  • Leader 选举
    第一步: 节点 A 成为候选者后,向其他节点发送请求投票 RPC 信息,请它们选举自己为领导者。

第二步: 节点 B 和 节点 C 接收到节点 A 发送的请求投票信息后,在编号为 1 的这届任期内,还没有进行过投票,就把选票投给节点 A,并增加自己的任期编号。

第三步: 节点 A 收到 3 次投票,得到了大多数节点的投票,从候选者成为本届任期内的 新的领导者。

第四步: 节点 A 作为领导者,固定的时间间隔给 节点 B 和节点 C 发送心跳信息,告诉节点 B 和 C,我是领导者,组织其他跟随者发起新的选举。

第五步: 节点 B 和节点 C 发送响应信息给节点 A,告诉节点 A 我是正常的。

五、领导者故障

  • 如果领导者节点出现故障,则会触发新的一轮选举。如下图所示,领导者节点 A 发生故障,节点 B 和 节点 C 就会重新选举 Leader。

  • 重新选主过程

第一步 : 节点 A 发生 故障,节点 B 和节点 C 没有收到领导者节点 A 的心跳信息,等待超时。

第二步: 节点 C 先发生超时,节点 C 成为 候选人。

第三步: 节点 C 向节点 A 和节点 B 发起请求投票信息。

第四步: 节点 B 响应投票,将票投给了 C,而节点 A 因为发生故障了,无法响应 C 的投票请求。

第五步: 节点 C 收到两票(大多数票数),成为 领导者。

第六步: 节点 C 向节点 A 和 B 发送心跳信息,节点 B 响应心跳信息,节点 A 不响应心跳信息。

六、选举规则总结

  • 任期
  • 领导者心跳信息
  • 随机选举超时时间
  • 先来先服务的投票原则
  • 大多数选票原则

七、Raft算法参考

https://raft.github.io/

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值