Raft 协议

Raft 是分布式一致性协议,是一种管理复制日志的一致性算法。

1. 角色

  1. Leader:接收客户端的请求,处理日志
  2. Candidate:用于选举Leader的中间角色
  3. Follower:响应来自Leader或者Candidate的请求

2. 选举过程

  1. 集群初始都是Follower,无Leader。
  2. Raft中各节点会有一个随机timeout时间,第一个结束timeout的Follower转换为Candidate,并递增任期开始选举,投票给自己并发送给其他Follower投票请求。
  3. 还未结束timeout的Follower只能响应Candidate的投票请求。
  4. 当收到大多数Follower的选票时,Candidate转换为Leader,其他Candidate则转换为Follower。
  5. Leader周期性发送心跳保持自己Leader角色。

注意:

  1. 所有节点初始状态都是Follower角色
  2. timeout时间内没有收到Leader的请求,则转换为Candidate进行选举
  3. Candidate在选举时,一个节点在一个任期内只能给一个Candidate投票,任期相同则选票先到先得;收到其他节点的请求,如果请求中的任期大于等于当前Candidate的任期,则认为其他节点为Leader,自身转换为Follower;若小与自身的任期,则拒绝请求并保持Candidate角色;发现Leader则转换为Follower
  4. Leader在收到更高任期的请求后转换为Follower
  5. 一段时间后仍旧没有Leader,可能平票,则在选举超时后重新发起一轮选举

3. 数据一致性

  1. Client发送请求到Leader
  2. Leader记录日志,标记为uncommitted,并复制给Follower
  3. Follower会在接收后,记录日志,标记为uncommitted
  4. 成功复制一小部分Follower
  5. 成功复制大于N>2的Follower,Leader将日志标记为committed,向Client发送已确认接收
  6. 再向所有Follower节点发送通知,表明该日志状态为committed,Follower接收后变更标记

4. 一致性意外处理

上述数据一致性,每个环节都可能出现Leader挂掉的情况

  1. Client -> Leader,Client发到Leader之前,Leader挂了。则重新选举新Leader,Client重试
  2. Client -> Leader-> Follower,Leader发到Follower之前,Leader挂了。则重新选举新Leader,Client重试
  3. Client -> Leader-> Follower,复制了一小部分Follower,Leader挂了,Leader日志标记为uncommitted。则从已标记uncommitted的Follower中,选举Leader,再继续进行复制。
  4. Client -> Leader-> Follower,复制了大于N/2的Follower,Leader挂了。Leader日志标记为committed,但Client还未接收到已确认接收的响应。则从已标记uncommitted的Follower中,选举Leader。Client发送重试请求,Raft集群各节点进行数据去重。
  5. 有A,B两个机房,三个节点在A,两个节点在B,Leader在A。当A,B网络中断,B中两个节点会选举新Leader。老Leader集群剩下三个节点,但还是按五个节点来处理,所以无法完成大于N/2个节点的复制响应。Client向老Leader发送的请求无法写入,向新header发送的数据可以写入。当A,B网络正常,A机房三个节点以Follower角色接入集群。

5. Raft 协议图示

1.选举开始前,各节点都是Follower,各节点开始随机timeout
1
2.第一个结束timeout的Follower,递增任期并转换为Candidate,投票自身并向其他Follower发送投票请求
2
3.当Candidate接收到大多数Follower的投票,则转换成Leader,其他节点转换为Follower。Leader会周期性发送心跳确认Leader
3
4.右键Leader,可发送request请求。Leader将日志标记为uncommited,并复制到Follower
4
5.Follower接收到请求,并标记日志为uncommited,响应Leader
5
6.Leader收到大于N/2个Follower的响应,将日志标记为commited,并响应客户端数据已确认
6
7.Leader向所有Follower节点发送通知,标记日志为commited
7
8.停掉Leader。其他节点在timeout时间内接收不到Leader的心跳,开始新的选举
8
9.继续请求,并记录日志
9
10.重启S5节点,以Follower角色加入集群,并同步之前的日志
10

参考:
说一说那些我也不太懂的 Raft 协议
解读Raft协议(一 算法基础)
Raft 动画
Raft 动画教程

  • 0
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值