Raft共识算法

吴代庄

于 2024-03-21 07:30:00 发布

阅读量1.2k

点赞数 39

分类专栏： Java 文章标签：分布式 Raft算法

本文链接：https://blog.csdn.net/Luck_gun/article/details/136891646

版权

Java 专栏收录该内容

49 篇文章 0 订阅

订阅专栏

引言

在分布式系统中，达成共识是一项至关重要的任务，它确保了即使在网络环境不稳定或存在故障节点的情况下，系统依然能够保持数据的一致性和正确性。Raft是一种被广泛研究和采用的共识算法，由Diego Ongaro和John Ousterhout于2014年提出，其设计目标是易于理解和实现，同时保持高效和可靠性。

一、Raft 简介

在这里插入图片描述

Raft通过将复杂的分布式一致性问题分解为几个直观的子问题来简化对共识的理解，主要包括以下三个核心组件：

领导者选举（Leader Election）：
在Raft中，集群中的一个节点被选为领导者，负责处理所有客户端请求并维护集群的一致性状态。当领导者失效时，其他节点会启动新的选举过程以选出新的领导者。
日志复制（Log Replication）：
领导者接收来自客户端的命令，并将这些命令作为日志条目追加到自己的日志中，然后发送给跟随者节点进行复制。只有当大多数跟随者成功复制了相同的日志条目后，该条目才会被认为是已提交的（committed），进而可以安全地应用于各节点的状态机。
安全性保证（Safety Guarantees）：
Raft通过一系列严谨的规则来确保不会发生冲突的日志条目被提交，即在同一任期（term）内每个日志位置仅能有一个唯一的值，并且日志的提交顺序严格遵循时间顺序。

二、Raft工作流程

领导者心跳与领导权维持：
在Raft共识算法中，领导者（Leader）的心跳与领导权维持是保持集群稳定和高效运行的关键环节。具体机制如下：

领导者心跳：
- 领导者会定期向所有跟随者（Follower）发送心跳消息（Heartbeat），通常是一个空的消息日志条目或者包含了当前任期号（Term）的信息。
- 这些心跳消息的发送频率相对较高，目的是让跟随者保持活跃并更新它们对领导者状态的认知。
超时与重新选举：
- 如果一个跟随者在一定时间间隔内（如选举超时时间）没有收到领导者的心跳或复制日志条目的请求，它将假设领导者已经失效，并且开始一个新的选举过程。
- 跟随者会将自己的状态转换为候选人（Candidate），并发起新一轮的领导人选举。
领导权维持：
- 当领导者成功发送心跳并接收到大多数节点（包括自己在内）的确认响应后，它可以继续维持其领导地位。
- 在每次接收到新的客户端请求时，领导者都会增加自己的任期号，并继续执行日志复制等操作，确保整个集群数据的一致性。

日志同步与快照：
在Raft共识算法中，日志同步和快照是保证分布式系统状态一致性和高效性的两个关键机制。

日志同步

日志追加：
- 当集群中的领导者（Leader）接收到客户端的写入请求时，它首先会将该请求作为一个新的日志条目附加到自己的日志中。
- 领导者会在每个任期（Term）内为每一条命令分配一个唯一的索引，并按顺序进行记录。
复制日志：
- 一旦领导者节点的日志条目被正确追加，它会并行地将这些日志条目发送给所有的跟随者（Follower）节点，要求它们复制这些日志条目。
- 跟随者节点在接收到日志条目后，会先检查该条目的任期号是否大于或等于自己已有的相同索引位置的日志，如果满足条件，则覆盖原有条目或在其之后追加新条目，并向领导者返回确认消息（AppendEntries RPC）。
提交日志：
- 当领导者接收到大多数跟随者的确认消息后，该日志条目就被认为已经提交（committed），这意味着它可以安全地应用到各节点的状态机上以改变系统状态。

快照

数据压缩与存储效率：
- 随着系统持续运行，日志文件可能会变得非常庞大。为了提高存储效率和降低恢复速度，Raft支持创建并分发系统的状态快照（Snapshot）。
触发条件：
- 当日志增长到一定大小，或者达到一定数量未提交的日志条目时，领导者节点可能触发快照生成过程。
快照制作与传播：
- 领导者节点会创建包含当前系统状态和最近已提交日志对应状态的快照，并将其持久化存储起来。
- 同样，领导者也会将这个快照发送给所有跟随者节点，跟随者接受快照后，可以丢弃已经被包含在快照内的日志条目，从而清理旧日志，减小存储负担。
恢复与追赶：
- 对于较晚加入集群的新节点，或者因网络分区暂时落后太多的节点，可以通过接收并应用最新的快照迅速赶上集群的最新状态，而无需从头开始同步整个日志。
日志压缩与冲突解决：
在Raft一致性算法中，日志压缩是一个重要的优化手段，用于解决长期运行服务中日志无限增长的问题。日志压缩通常通过创建和应用快照来实现：

快照（Snapshotting）：
- 当Raft集群中的节点发现其日志过大时，可以生成当前状态机的快照。
- 快照包含了到某个特定索引为止的所有已提交（committed）日志条目所表示的系统状态。
- 创建快照后，节点可以丢弃快照之前的日志条目，从而极大地减少了存储空间占用。
传播与应用快照：
- 领导者节点在制作快照之后，会将其发送给所有跟随者节点。
- 跟随者接收到快照后，会更新本地状态，并将与快照对应的旧日志删除，同时更新其最后应用的索引值和任期号信息。
冲突解决：
- 在Raft中，日志的一致性是通过AppendEntries RPC的机制来维护的，其中包括了日志条目的索引、任期号以及前一条日志的索引和任期号作为参数。
- 如果在同步过程中发现日志存在不一致（如跟随者的日志包含领导者没有的日志条目或任期号冲突），领导者会根据Raft算法的规则强制跟随者删除与其不一致的部分，直到两者的日志达到一致状态。

日志匹配性质：
- Raft保证了对于任意两个具有相同索引的日志条目，在不同的节点上它们的内容和任期号必须相同（Log Matching Property）。
- 日志压缩不会破坏这一性质，因为快照包含了整个状态的确定性转换，而非单个日志条目的细节。

三、Raft的关键优势

Raft之所以受到青睐，是因为其具备以下几个显著优点：

清晰的结构：Raft将复杂的交互步骤明确划分为不同的角色和状态转换，这使得开发者更容易理解和实现。
强领导模型：单一领导者简化了决策过程，并有助于降低网络通信复杂度。
容错能力：Raft能够在部分节点失效或网络分区情况下继续运作，只要集群中多数节点存活且能够互相通信，就能保证系统的可用性和数据一致性。

四、Raft的应用

RocketMQ

在这里插入图片描述

RocketMQ在实现高可用和数据一致性方面采用了基于Raft协议的Dledger机制。Dledger是一个分布式的日志存储系统，它使用Raft共识算法来保证多副本间的数据同步和主从切换时的一致性。

具体来说，在RocketMQ中：

DLedger（Distributed Ledger）：
- RocketMQ引入了DLedger作为其消息存储的核心组件，尤其是在4.5版本及后续版本中。
- DLedger利用Raft协议实现了消息的日志复制和持久化存储，确保即使在节点故障的情况下，集群也能通过自动切换保证服务连续性和数据完整性。
多副本与选主机制：
- 每个队列都有多个副本分布在不同的Broker上，这些Broker组成了一个Raft Group。
- Raft Group内部通过选举产生一个领导者（Leader），负责处理客户端请求以及将写入操作同步到所有追随者（Follower）节点上。
- 当Leader出现故障时，Raft协议会自动触发新的选举过程，选出一个新的Leader继续提供服务。
数据同步与持久化：
- 在RocketMQ中，每条消息都会被持久化到各个Broker上的CommitLog中，并通过Raft协议进行跨节点同步。
- 由于采用Raft协议，每个消息的写入都具有强一致性保障，只有当大多数节点成功写入该消息后，这个消息才被认为是已提交（committed）。

Redis

Redis Sentinel（哨兵）模式虽然在设计上并未直接采用完整的Raft一致性算法，但在实现节点间的领导者选举和故障转移决策时借鉴了类似Raft的投票机制来达成分布式共识。以下是Redis Sentinel中与Raft理念相关的部分：

领导者选举：
当主服务器（Master）出现故障时，Sentinel系统中的各个Sentinel实例会通过一种基于法定数量（quorum-based）的投票方式来选出一个“领导者” Sentinel。这个过程类似于Raft协议中的Leader选举，在达到一定数量的Sentinel同意的情况下，决定进行故障转移并执行相关操作。
状态传播与同步：
Sentinel实例之间使用 gossip 协议（流行病传播协议）来传播和同步关于主服务器和其他从服务器的状态信息。尽管这不是Raft协议的一部分，但状态传播是分布式系统中实现一致性的基础。
故障转移决策：
一旦确定需要进行故障转移，被选为领导者的 Sentinel 将负责发起故障转移流程，并确保新的主服务器被正确地推选出来，同时通知其他从服务器切换至新主。在这个过程中，Sentinel集合通过某种形式的多数派决策来达成对新主的一致认可，这种思路与Raft协议中的共识形成原则相呼应。

Redis Sentinel模式在处理高可用性问题时，虽然没有严格遵循Raft协议的所有步骤和细节，但它在核心的领导者选举和决策一致性方面汲取了类似Raft的一些原理，以确保在发生故障时能够快速、安全地完成主从切换。

吴代庄

关注

39
点赞
踩
14

收藏

觉得还不错? 一键收藏
打赏
1
评论
Raft共识算法

Raft算法是一种简洁且易于理解的分布式一致性协议，其核心在于领导者选举、日志复制与状态机应用。在每个任期中，节点通过竞选成为领导者，并定期发送心跳维持领导权。领导者接收客户端请求，将操作以日志条目形式追加到本地，并同步给跟随者，当大多数节点确认后提交该日志。为解决存储和恢复效率问题，Raft引入了快照机制压缩历史数据。此外，它通过严格的日志匹配规则有效处理冲突，确保集群内部各节点的日志一致，最终实现分布式系统的一致性。
复制链接

扫一扫