Paxos -- 介绍

最新推荐文章于 2023-12-09 09:45:45 发布

laohan_

最新推荐文章于 2023-12-09 09:45:45 发布

阅读量1.9k

点赞数 1

分类专栏： Distributed System

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/laohan_/article/details/21197117

版权

Distributed System 专栏收录该内容

9 篇文章 0 订阅

订阅专栏

Paxos 的理解困境

1 Paxos究竟在解决什么问题？

2 Paxos如何在分布式存储系统中应用？

3 Paxos算法的核心思想是什么

第一阶段在做什么

第二阶段在做什么

Paxos 用来确定一个不可变量的取值

1、取值可以是任何二进制数据

2、一旦确定将不再更改，并且可以被获取到(不可变性、可读性)

在分布式存储系统中应用Paxos

1、数据本身可变，采用多副本进行存储

2、多副本的更行操作序列[Op1,Op2,…,Opn]是相同的，不变的

3、用Paxos依次来确定不可变量Opi的取值（即第i个操作是神什么）

4、每次确定完Opi之后，让各个数据副本执行Opi，依次类推。

Google的Chubby、Megastore 和Spanner都采用了Paxos来对数据副本的根性序列达成一致

Paxos 希望解决的一直性问题

设计一个系统，来存储名称为var的变量

1、系统内部由多个Acceptor组成，负责存储和管理var变量。

2、外部有多个proposer机器任意并发调用API，想系统提交不同的var取值，var的取值可以是任意二进制数据

3、系统对外的API库接口为：propose(var,V)=> <ok,f> or <error>

系统需要保证var的取值满足一致性

1、如果var的取值没有确定，则var的取值为null

2、一旦var的取值被确定，则不可以被更改。并且可以一直获取到这个值

系统需要满足容错特性

1、可以容忍任意propose机器出现故障

2、可以容忍少数Accptor故障（半数一下）

暂时不考虑网络分化和 acceptor故障丢去var的信息。

确定一个不可变变量—难点

1、管理多个Proposer的并发执行

2、保证var变量的不可变性

3、容忍任意Proposer机器故障

4、容忍半数以下Acceptor机器故障

确定一个不可变量变量的取值----方案1

1、先考虑系统由单个Acceptor组成。通过类似互斥锁机制，来管理并发的proposer运行。

2、 Proposer首先向Acceptor申请Acceptor的互斥访问权，然后才能请求Acceptor接受自己的取值。

3、 Acceptor给Proposer发放互斥访问权，谁申请到互斥访问权，就接收到谁提交的取值。

4、让Proposer按照获取互斥访问权的顺序依次访问Acceptor

5、一旦Acceptor接受了某个Proposer的取值，则认为var取值被确定，其他Proposer不再更改

基于互斥访问权的Acceptor的实现

1、 Acceptor保存变量var和一个互斥锁lock

2、 Acceptor::pareprare():

加互斥锁，给予var的互斥访问权，并返回var当前的取值f

3、 Acceptor::release():

解互斥锁，收回var的互斥访问权

4、 Acceptor::accept(var,V):

如果已经加锁，并且var没有取值，则设置var为V。并且释放锁

Propose(var,V)的两阶段实现

1、第一阶段：通过Acceptor::prepare获取互斥访问权和当前var的取值，如果不能返回<error>（锁被别人占用）

2、第二阶段：根据当前var的取值f，选择执行

如果f为null，则通过Acceptor::accept（var,V）提交数据V

如果f不为空，则通过Acceptor::release()释放访问权，返回<ok,f>

通过Acceptor互斥访问权让Proposer序列运行，可以简单的实现var取值的一致性

Proposer在释放互斥访问权之前发生故障，会导致系统陷入死锁

不能容忍任意Proposer机器故障

确定一个不可变变量的取值----方案2

引入抢占式访问权

1、 Acceptor可以让某个Proposer获取到的访问权失败，不再接收它的访问，之后，可以将访问权发给其他Proposer，让其他Proposer访问Acceptor

2、 Proposer向Acceptor申请访问权时指定编号epoch（越大的epoch越新），获取到访问权之后，才能向Acceptor提交取值。

3、 Acceptor采用喜新还旧的原则

一旦收到更大的新epoch的申请，马上让旧epoch的访问权失败，不再接受他们提交的取值。

然后给新epoch发放访问权，只接收新epoch提交的取值

4、新epoch可以抢占旧epoch，让旧epoch的访问权失败，旧epoch的Proposer将无法运行，新epoch的Proposer将开始运行

5、为了保持一致性，不同epoch的Proposer之间采用“后者认同前者”的原则

5.1 在肯定旧epoch无法生成确定性取值时，新的epoch会提交自己的value，不会冲突

5.2一旦旧epoch形成确定性取值，新的epoch可定可以获取到此值，并且会认同此取值，不会破坏

基于抢占式访问权的Acceptor的实现

1、 Acceptor保存的状态

当前var的取值<accepted_epoch, accepted_value>

最新发放访问权的epoch(lasted_prepared_epoch)

2、Acceptor::preprare(epoch):

只接收比lasted_prepared_epoch更大的epoch ，并给予访问权，记录lasted_prepares_epoch=epoch

3、 Acceptor::accept(var ,prepared_epoch, V ):

验证lasted_prepared_epoch == prepared_epoch ,并设置var的取值<accepted_epoch,accepted_value> = <prepared_epoch,v>.

Proposer(var , V)的两个阶段实现

第一阶段：获取epoch 轮次的访问权和当前var的取值

简单选取当前世界戳为epoch，通Acceptor::prepare(epoch)，获取epoch轮次的访问权和当前var的取值

如果不能获取，返回<error>

第二阶段：采用“后者认同前者”的原则选定取值，进行提交。

1、如果var的取值为空，则可定当前没有确定性取值，则通过Acceptor::accept(var, epoch , V)提交数据V，成功后返回<ok,V>

如果Acceptor失败，返回<error>(被epoch抢占或者Acceptor故障)

2.、如果var取值存在，则此值肯定是确定性取值，此时认同它不再更改，直接返回<ok, epoch_old , accepted_value>

总结

基于抢占式访问权的核心思想：

让Proposer将按照epoch递增的顺讯抢占式的依次运行，后者认同前者。

可以避免proposer机器故障带来的死锁问题，并且可以var取值的一致性。

但是还得引入多Acceptor

单机模块Acceptor是故障导致整个系统yuanji ，无法提供服务

关于方案1

如何控制proposer的并发运行？

为何可以保证一致性？

为什么会有死锁问题？

关于方案2

如何解决方案1的死锁问题？

在什么情况下，Proposer可以将var的取值确定为自己提供的取值？

抢占式访问权机制的运行过程

图一

图二（#1表示P1获取了访问权）

图3(现在是P2抢占获得了访问权，而P1保存着过期的访问权，此时Acceptor里面的lasted_prepared_epoch 比P1的大)

图4（P2成功设置了V2）

图5（P1的访问权已经失效了，所以Acceptor(#1,V1)失败）

图6（P3prepare(#3)成功，但是会返回<ok.#2,V2>，因为var已经被设置了，起到了一致性作用，所以不会在更改var的值）

Summary :

基于抢占式访问权的思想

让Proposer将按照epoch递增的顺序抢占式的依次运行，后者会认同前者。

可以避免Proposer机器故障带来的死锁问题。并且还可以保证var取值的一致性

但是还需要引入多Acceptor

单机模式Acceptor是故障导致整个系统down 机，无法提供服务

思考题--- 关于方案1和方案2

Problem：

关于方案1 ：

如何控制Proposer的并发运行？

为何可以保证一致性？

为什么会有死锁问题？

关于方案2

如何解决方案1的死锁问题

在什么情况下，Proposer可以将var的取值确定为自己提供的取值？

如何保证新epoch不会破坏已经达成的确定性取值？

确定一个不可变变量的取值-----Paxos

1、Paxos在方案2的基础上引入多个Acceptor

Acceptor的实现保持不变，仍采用“喜新厌旧”的原则运行。

2、Paxos采用“少数服从多数”的思路

3、一旦某epoch的取值f被半数以上Acceptor接受，则认为此var取值被确定为f，不再更改

Paxos的运行步骤：

1、 Proposer(var , V )第一阶段：选定epoch，获取epoch访问权限和对应的var取值

获取半数以上aceeptor的访问权和对应的一组var取值

2、 Proposer（var ， V ）第二阶段：采用“后者认同前者”的原则执行

在肯定旧epoch无法生成确定性取值时，新的epoch会提交自己的取值，不会冲突。

一旦旧epoch 形成确定性取值，新的epoch肯定可以获取到此取值，并且会认同此取值，不会破坏

2.1、如果获取的var取值为空，则旧epoch无法形成确定性取值，此时努力使<epoch,V>成为确定性取值。

向epoch对应的所有Acceptor提交<.epoch,V>.

如果收到半数以上成功，则返回<ok,V>

否则，则返回<error>（被新epoch抢占或者Acceptor故障）

2.2、如果var的取值存在，认同最大accepted_epoch 对应的取值，努力使<epoch,f>成为确定性取值

如果f出现半数以上，则说明f已经是确定性取值，直接返回<ok,f>

否者，向epoch对应的所有Acceptor提交取值<epoch,f>

图2-1（P1获取到3个访问权）

图2-2（P1向Acceptor1提交var取值，已经成功返回，接着向Acceptor2,3提交var取值，但是在此之前P2抢占式访问）

图2-3（P2抢到Acceptor1,2的访问权，Acceptor1返回被P1设置的V1取值，而Acceptor2还没有确定性取值，所以返回null）

图2-4

记住：确定值F占半数以上，成功请求访问权要超过半数，所以请求访问权如果成功，至少会包含一个确定值F（除非var为nil），然后求最大的版本号对应的F值

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
Paxos -- 介绍

最经在弄论文，zk的原理还是不太明白，听说zk这些协调系统都是基于Paxos算法演变出来，看来得先理解Paxos算法才行。下面是本人根据网上资料对Paxos做的总结，希望对和我一样的菜鸟有点好处（错了，来吐槽吧，文明点）Paxos 的理解困境 1 Paxos究竟在解决什么问题？2 Paxos如何在分布式存储系统中应用？3 Paxos算法的核心思想是什么
复制链接

扫一扫

专栏目录

laohan_ CSDN认证博客专家 CSDN认证企业博客

码龄13年

224: 原创

17万+: 周排名

144万+: 总排名

46万+: 访问

: 等级

6986: 积分

108: 粉丝

56: 获赞

35: 评论

208: 收藏

私信

关注

热门文章

分类专栏

最新评论

如何计算地址线和数据线
端文: 我看了这个文章一直算不对(~_~;)，原来都是对的。好几篇错的文章了
如何计算地址线和数据线
旧西风: 你牛皮啊，害我算这么久，我说怎么一直错
如何计算地址线和数据线
KIGH小橙子: 这个通过存储芯片的结构会好理解一些。 MAR的位数对应地址线的条数，比如有3位，那就能表示000、001、010...一共能表示出2^3=8个地址，那16M=2^4×2^20个，就需要24位。MDR就直接对应每个单元里的字长了，有几位就需要几条来表示。因为本身这个表示格式就是：存储单元个数×存储字长
如何计算地址线和数据线
程序猿鸣员: 萌新一个，现在学得很痛苦
如何计算地址线和数据线
程序猿鸣员: 请问，有人能告诉我为啥地址线看的是内存范围2的几次方，而数据线直接看字长的位数吗

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。