【分布式系列文章】Multi-Paxos的具体落地:Raft算法~

写在前面

接触分布式已数月有余,从zk到dubbo到springcloud都只是停留在应用层,此系列文章将深入探讨分布式背后的实现算法,如何保证分布式下的容灾与数据一致性,由于笔者水平有限,只是以自己的理解记录分布式算法实现,严谨的推导过程仍需另寻其他神犇~

阅读前可参考博主的另一篇文章:带你通俗理解Paxos算法

一、宏观理解Raft算法

  • 了解过Paxos算法我们熟知:Basic-Paxos有许多问题,比如提案活锁,两次RPC最主要是角色过于复杂难以落地实现,所以引出了Multi-Paxos算法,简化了角色定义,Raft就是Multi-Poxos的具体实现算法之一
  • Raft算法将问题划分为了三个子问题:Leader Election(领导者选举)、Log replication(日志复制)、Safety(安全恢复),关于每个状态的行为我们在后文中讲解
  • Raft算法重新定义了角色:分为Leader(领导)、Follower(追随者)、Candidate(候选者),并且一个节点的角色是可以改变的,具体的角色变化我们后文讲到

二、Leader Election:详解选举过程

具体流程结合动图网站理解更佳Raft动图演示

1.首先我们明白几个概念:

  • 选举过程是由两个超时时间来控制的:election timeout:也就是说在election timeout内Follow没有收到Leader的心跳检测,就会成为Candidate,通常是150ms到300ms的随机值;heartbeat timeout:发送心跳检测的时间间隔

2.整个流程

  • 集群初始没有Leader,各个节点最先经过election timeout的节点会成为Candidate候选者
  • Candidate会立即开启一个选举任期,首先它会投自己一票,并发送投票请求给其他节点
  • 接着每个Follow会响应投票,并且每个选举任期只能投一票,并且会重置election timeout,防止Leader还活着呢,Follow就像篡位
  • 一旦Candidate获得了大多数Follow的投票就会立马变成Leader,如果没办法票数不能超过一半就无法选出Leader,会清空计时重新选Candidate
  • 接着Leader为了维护自己的地位,每搁一个heartbeat timeout就会向Follow发送心跳检测重置Follow的election timeout,Leader一句话:你们不要 BB! 按我说的做,做完了向我汇报!"
  • 这个选举任期直到Leader挂了,Follow没有在election timeout内收到心跳检测为止

3.接下来是异常流程

a).Leader任期结束了,怎么重新选举?

  • 如果Follow没有在election timeout内收到心跳检测就会变成Candidate,然后立马发起新一任的选举投票,投票成功就会当选新的Leader

b).如果有两个Follow同时成为Candidate怎么办?

  • 如果同时有两个Candidate在同一任期内进行选举,并且票数相同,那么此时所有节点所有节点开始重新计时变为Candidate,由于election timeout是随机数,所以一定会出现一个唯一的Candidate

三、Log replication:日志复制过程

当我们选出Leader后,所有的请求必须经过Leader,整个集群又是如何达成数据一致性的呢?也就是说我们一旦选出了Leader,我们需要将对Leader的修改同步复制到所有的Follow

具体流程如下:

  • 记得我们前文提到的心跳检测么?对于数据的同步操作就是追加在心跳包中一起发送给Follow
  • 当Client发起一个请求比如set x = 5,首先这个请求会发给Leader,首先这条指令会加入到Leader的日志文件中,此时Leader并没有真正地修改数据
  • 接着会把set x = 5请求加入到下次的心跳检测包中发给Follow,Follow会发送ACK给Leader并且把指令写到Log中并没有真正修改数据
  • 当Leader收到全部数量的Follow,首先真正修改数据,然后返回给客户端请求结果,接着在下次心跳包中告诉Follow去真正地修改数据,Follow收到后进行数据修改
  • 我们不难看到,也是两阶段提交协议,两阶段提交协议是保证一致性地常用手段

四、我们都说Raft分区容错性强,强在哪?

我们假设一种场景,原本正常地集群出现网络分区后怎么办?
在这里插入图片描述- 此时可以看到虚线上方地三个Follow无法再接受到Leader的心跳检测了,所以三个Follow会开始再election timeout到时后成为Candidate重新选举Leader,并且两个Leader的任期是不同的,最终会变成下图状态
在这里插入图片描述

  • 同时由于共5个节点,下半分区Leader在接收Follow反馈时,无法得到大多数节点反馈,所以不能此时指令只能写入到log中,无法真正写入,也就是无法执行二阶段提交的第二阶段执行
  • 当分区恢复后,任期计数大的Leader会成为新集群的Leader,分区下方的节点会回滚还未提交的事务,并且同步新Leader的日志达成集群的一致性
  • 所以即使强如Raft算法,再出现网络分区后,也会出现数据不一致地情况,比如客户端是无法感知出现网络分区地,我们向产生分区前地Leader发送请求,那么请求只能保证上图中下半分区一致,和上半分区也会出现不一致地情况,但一旦网络分区消除,整个集群又会达成一致性的场景

五、写在最后

Raft算法和ZAB协议都是基于Paxos算法,ZAB协议会在后序系列文章中逐渐展开描述,觉得不错点个赞就是对博主最大的鼓励,水平有限难免有理解不到位的地方,欢迎评论区讨论~

理论终归是理论,博主近期尝试将Raft算法落地实战,敬请期待~

参考

  • B站分布式算法视频:地址
  • Raft动图网址:Raft动图演示
  • 极客专栏:分布式协议与算法实战
  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值