一、什么是CAP理论
CAP理论观点是,在分布式计算机系统中不可能同时提供一下全部三个保证:
- 一致性(Consistency):所有节点同一时间看到的是相同的数据。
- 可用性(Availability):不管是否成功,确保每一个请求都能接收到响应。
- 分区容错性(Partition tolerance):系统任意分区后,在网络故障时,仍能操作。
二、为什么只能三选二?
下面举例说明为什么只能三选二。
上图表示在一个网络中,存在N1和N2两个节点,他们都共享数据块V,其中有一个值是V0。运行在N1上的A程序可以认为是安全的、无Bug的、可预测的和可靠的。运行在N2 上的是B程序。在这个例子中,A将写入V的新值,而B从V中读取值。
系统预期执行下面的操作:
(1)、如上图,首先写一个V的新值V1,
(2)、然后消息(M)从N1更新V的副本到N2
(3)、现在,从B读取返回的V1。
如果网络是分区的,当N1到N2的消息不能传递时,就会发生下面的情况,虽然N2能访问到V的值(可用性),但是其实与N1 的V的值已经不一致了(一致性):
三、CAP常见模型
既然CAP理论已经证明了一致性、可用性、分区容错性三者不可能同时达成。那么在实际应用中,可以在其中的某一些方面来放松条件,从而达成妥协。下面介绍常见的三种模型。
1.牺牲分区(CA模型):
牺牲分区容错性意味着把所有的机器搬到一台机器内部,或者放到一个“要死大家一起死”的机架上,这明显违背了我们的可伸缩性。
CA模型常见应用实例:
- 单站点数据库
- 集群数据库
- LDAP
- XFS文件系统
实现方式:
- 两阶段提交
- 缓存验证协议
2.牺牲可用性(CP模型):
牺牲可用性意味着一旦系统中出现分区这样 的错误,系统就直接停止服务。
CP模型常见例子:
- 分布式数据库
- 分布式锁定
- 绝大部分协议
实现方式:
- 悲观锁
- 少数分区不可用
3.牺牲一致性(AP模型):
AP模型常见应用:
- Coda
- Web缓存
- DNS
实现方式:
- 到期/租赁
- 解决冲突
- 乐观
四、BASE理论
BASE:Basically Available、Soft State、Eventual consistenty。是基于CAP理论发展而来的。
核心思想:即便不能达到强一致性(Strong consistency),但可以根据应用特点采用适当的方式来达到最终一致性(Eventual consistency)的效果。Base是对CAP中的C和A的延伸
- Basically Available:基本可用
- Soft State:弱状态,即状态可以有一段时间不同步
- Eventual consistenty:最终一致性。