概论
在分布式系统中,数据通常会存储多个副本,如何维持副本之间的一致性则是一个比较经典的问题。Paxos是一个比较经典的一致性算法,本文将对paxos进行简单的介绍。
Paxos算法以难以理解著称,因此后来也提出了一个更容易理解的算法Raft,在https://blog.csdn.net/qq_34924156/article/details/111589352这篇文章中有简单介绍。
Paxos算法
问题定义
一致性:
当前有一组process,每个process都能提出一个提案(value),因为这一组process需要执行相同的提案,因此需要从决策提案中选择一个执行。最终这一组process会执行被选择的这个提案。
转换到分布式存储,可以理解为有一组副本存储相同的数据,每个副本都能提出修改数据的建议,但是因为副本组需要维持副本数据相同,因此最终只有一个修改建议会被选择执行。
一致性协议的目标:
- 选择一个提案(存在提案的话),并告知所有process被选择的提案。
- 异步通信,允许消息的丢失或者重复,但是不会出现内容损坏的情况(即非拜占庭模型),允许机器故障等问题。
一致性的安全性:
- 提案只有被提出后才能后选择
- 只有一个提案被选择
- 如果提案未被选择,那么process不会收到该提案被选择的消息。(即只会收到正确的被选择消息)
注:一致性算法没有特别精确的时间要求。
主要角色:提案者(proposer),批准者(acceptor),接收者(listener)。一个process可以担任多个角色。
提案的选择
基本原则:当有多数acceptor批准某一提案,提案就被选择。
- 一个acceptor只能批准一个提案。
- 不能只选择一个acceptor是因为单个acceptor存在单点故障,如果该acceptor故障系统就不能继续运行了。
算法过程:
两阶段过程:
1. Proposer:选择一个议案编号n,向acceptor的多数派发送编号也为n的prepare请求。
Acceptor:如果接收到的prepare请求的编号n大于它已经回应的任何prepare请求,它就回应已经批准的编号最高的议案(如果有的话),并承诺不再回应任何编号小于n的议案;