Paxos是一种提高分布式容错性的一致性算法,google chubby系统的创建者Mike Burrows就说过,世界上只有一种分布式一致性协议,就是Paxos,其他不过是Paxos的变种而已。
首先要了解,Paxos中有三个角色
- Proposer:提议发起者。Proposer 可以有多个,Proposer 提出议案(value)。所谓 value,可以是任何操作,比如“设置某个变量的值为value”。不同的 Proposer 可以提出不同的 value,例如某个Proposer 提议“将变量 X 设置为 1”,另一个 Proposer 提议“将变量 X 设置为 2”,但对同一轮 Paxos过程,最多只有一个 value 被批准。
- Acceptor:提议接受者;Acceptor 有 N 个,Proposer 提出的 value 必须获得超过半数(N/2+1)的 Acceptor批准后才能通过。Acceptor 之间完全对等独立。
- Learner:提议学习者。上面提到只要超过半数accpetor通过即可获得通过,那么learner角色的目的就是把通过的确定性取值同步给其他未确定的Acceptor。
Paxos究竟在解决什么问题?
Paxos主要是用来确定一个不可变变量的取值
- 取值一旦确定将不可被更改,并可以被获取到(不可变性、可读性)
用一句话来说,就是:
proposer将发起提案(value)给所有accpetor,超过半数accpetor获得批准后,proposer将提案写入accpetor内,最终所有accpetor获得一致性的确定性取值,且后续不允许再修改。
Paxos如何在分布式系统中应用?
在分布式系统中,数据本身是可变的,并采用多副本进行存储。
但是在分布式系统中,如果对多个副本执行更新操作时,因为网络延迟,超时和各种故障等一系列的原因导致各个副本之间的更新操作不一样 ,这样就很难保证一致性。Paxos就是用来保证各个副本之间的跟新是相同的。
例子
设计一个系统用来存储名为Var的变量,系统内部由多个Acceptor组成,负责管理存储Var变量。
系统需要保证Var的取值满足一致性,也就是不管在哪个节点上取Var值,得到的都是相同的结果。如果Var没被确定,就为null,但是Var值一旦被确定,则不能再被更改,并保证能够一直获取到这个值。
系统同时能够有一定的容错性,可以容忍任意Proposer机器出现故障,也可以容忍半数以下Acceptor故障。