Paxos算法3-实现探讨

最新推荐文章于 2024-05-21 09:30:00 发布

原创

最新推荐文章于 2024-05-21 09:30:00 发布 · 1.9w 阅读

13 ·

CC 4.0 BY-SA版权

文章标签：

#算法 #server #google #工作 #crash #null

本文深入探讨Paxos算法的实现，分析了Proposer、Acceptor、Learn的角色及其交互，涉及编号规则、实例（instance）、提案（proposal）和值（value）的概念，以及Phase1和Phase2的关键步骤。文章指出在实际工程中要考虑多种错误情况，如磁盘损坏、文件损坏和Leader身份丢失，并讨论了错误处理策略和持久化的重要性。

前两篇Paxos算法的讨论，让我们对paxos算法的理论形成过程有了大概的了解，但距离其成为一个可执行的算法程序还有很长的路要走，原因是很多的细节和错误未被考虑。Google Chubby的作者说，paxos算法实现起来远没有看起来简单，原因是paxos的容错仅限于server crash这一种情况，但在实际工程实现时要考虑磁盘损坏、文件损坏、Leader身份丢失等诸多的错误。

1. Paxos各角色的职能

在paxos算法中存在Client、Proposer、Proposer Leaer、Acceptor、Learn五种角色，可精简为三种主要角色：proposer、acceptor、learn。角色只是逻辑上存在的，在实际实现中，节点可以身兼多职。

在我们的讨论中，我们先假定没有Proposer Leader这一角色，在不考虑活锁的情况下，如果算法过程正确，那有Leader角色的算法过程肯定也正确。

除了五种角色，还有三个重要的概念：instance、proposal、value，分别代表：每次paxos选举过程、提案、提案的value

当然，还有4个关键过程：

(Phase1)：prepare
(Phase1)：prepare ack
(Phase2)：accept
(Phase2)：accept ack

对acceptor来说，还蕴含是着promise、accept、reject三个动作。

先上一幅图，更直观地对几种角色的职能加以了解（各角色的具体职能参考Lamport的论文就足够了）：

Paxos各角色职责

上图不是非常严格，仅为表现各角色之间的关系。

2. Proposer

在Proposer、Acceptor、Learn中均涉及到proposal的编号，该编号应该有proposer作出改变，对其他的角色是只读的，这就保证了只有一个数据源。当多个proposer同时提交proposal时，必须保证各proposer的编号唯一、且可比较，具体做法之前已经提到。这里还要强调一点的是，仅每个proposer按自己的规则提高编号是不够的，还必须了解“外面”的最大编号是多少，例如，P1、P2、P3（请参考：Paxos算法2#再论编号问题：编号唯一性）

P3的当前编

最低0.47元/天解锁文章