CAP原理是分布式系统的基础理论,它指出所有的分布式系统最多只能满足其中的两条:
- 一致性(Consistency)
- 可用性(Avaliability)
- 分区容错(Partition tolerance)
本次证明是参考Gilbert和Lynch的证明的带图片说明版。
什么是CAP理论?
CAP理论指出,一个分布式系统无法同时满足一致性、可用性和分区容错。那么,什么是一致性,什么是可用性,什么又是分区容错,而分布式系统又指什么?
下面,我们会引入一个简单的分布式系统,并解释分布式系统的一致性、可用性和分区容错具体指什么。形式化的描述请参考Gilbert和Lynch发表的论文。
一个分布式系统
我们考虑一个简单的分布式系统。系统有两个服务器G1和G2,它们都存储一个变量V,值都是V0,G1和G2可以相互通信并且可以被客户端访问。
客户端可以向两个服务器进行读写操作,当一个服务器接收到请求之后,完成相应的一些操作,之后返回客户端。
一致性
下面是Gilbert和Lynch对一致性的描述:
any read operation that begins after a write operation completes must return that value,or the result of a later write operation.
一致性要求,客户端完成对任意一个服务器的写操作之后,无论从哪个服务器都要读出一致的结果。
一个不满足一致性的系统:客户端从G1和G2读到不一致的结果。
满足一致性的系统:客户端从G1和G2读到一致的结果。
可用性
下面是Gilbert和Lynch对可用性的描述:
every request received by a non-failing node in the system must result in a response.
每一个请求都要得到系统的响应。
一个可用的系统,只要系统没有崩溃掉,就必须对客户端请求作出响应,即服务器不允许忽略客户端的请求。
分区容错
下面是Gilbert和Lynch对分区容错的描述:
the network will be allowed to lose arbitrarily many messages send from one node to another.
服务器之间的网络丢包是允许的。
这就意味着G1和G2之间的消息可能被丢弃,如果所有的消息都被丢弃了,系统将会如下:
在这种情况下,我们的系统的功能也必须是可用的,以达到分区容错的目的。
为什么分布式系统只能满足其中两条的证明
使用假设法证明,假设存在分布式系统同时满足一致性、可用性和分区容错,首先,如下系统是满足分区容错的:
然后,客户端请求服务器G1,把V的值由V0改为V1,根据可用性,G1必须回复请求;根据分区容错,G1向G2发送消息出错是允许的。
最后,客户端向服务器G2发送请求读取V的值,根据可用性,G2必须响应请求;由于分区容错G2不能从G1中更新V的值,所以返回的值是V0。
G2返回的值是V0,但客户端已经把V1写入到G1了,系统是不一致的。
我们假设满足一致性、可用性和分区容错的系统是存在的,根据上面的过程却推导出系统是不一致的,由此证明没有这样的系统存在。