CAP定理
CAP理论告诉我们:一个分布式系统不可能同时满足一致性(Consistency),可用性(Availability)和分区容错性(Partition tolerance)三个基本要求,最多只能同时满足其中的两项。
一致性C
分布式环境中,一致性是指数据在多个副本之间是否能够保持一致的特性。在一致性的需求下,当一个系统在数据一致的状态下执行更新操作后,应该保证系统的数据仍然处于一致的状态。
强一致性:在分布式系统中,如果能够做到针对一个数据项的更新操作执行成功后,所有的用户都可以读取到其最新的值,那么这样的系统就被认为有强一致性。
可用性A
可用性是指系统提供的服务必须一直处于可用的状态,对于用户的每一个操作请求总是能够在有限的时间内返回结果。
分区容错性P
一个分布式系统需要具有如下特性:分布式系统在遇到任何网络分区故障的时候,仍然需要能够保持对外提供满足一致性和可用性的服务,除非是整个网络环境发生了故障。
网络分区:分布式系统中,不同节点分布在不同的子网络中,由于一些特殊的原因导致这些子网络之间出现网络不连通的状况,但各个子网络的内部网络是正常的,从而导致整个系统的网络环境被切分成了若干个孤立的区域。
分区容错性是一个分布式系统必然需要面对和解决的问题。系统架构设计师往往把精力花在如何根据业务特点在C和A之间寻求平衡。
协议分析
两阶段提交协议
两阶段提交系统具有完全的C,很糟糕的A,很糟糕的P。
- 首先,两阶段提交协议保证了副本间是完全一致的,这也是协议的设计目的。
- 再者,协议在一个节点出现异常时,就无法更新数据,其服务可用性较低。
- 最后,一旦协调者与参与者之间网络分化,无法提供服务。
Lease机制
Lease机制牺牲了部分异常情况下的A,从而获得了完全的C与很好的P。
上面这句话有点抽象,下面一一解释。
- 首先,Lease机制不是在任何情况下都具有可用性的,使用Lease机制的协议,在发生异常时,需要等待Lease超时才能收回Lease权限。然而,Lease的持有者可能在Lease超时前就已经出现异常而不能供服务了,直到Lease超时这段时间内,系统服务的可用性都有问题。
- 例如,如果用lease决定Primary副本的,Primary副本节点宕机后,只有待Lease超时才能选出新的primary副本,这段时间由于缺乏primary副本是没有更新服务的。
- 再者,Lease协议本身保证了对于Lease约定的承诺在Lease颁发者和持有者之间是始终一致的。即使Lease持有者由于网络分化没有真正收到Lease,Lease颁发者也会在Lease时间内执行自己的承诺;而一旦Lease持有者收到Lease,则即使再出现网络分化,也无法影响双方对Lease承诺理解的一致性。
- 最后,Lease协议引入了“时间”这一概念,使得在对抗网络分化上有其特别的优势,另外,Lease只需由颁发者向持有者通信,即使网络是单向的也不影响Lease协议的正常工作。
Quorum机制
这里仅讨论一般的 Quorum 机制,即总共有N个副本,成功更新W个副本则算成功交,读取时读R个副本。这种一般的Quorum机制,在CAP三大因素中都各做了折中,有一定的C,有较好的A,也有较好的P,是一种较为平衡的分布式协议。
Paxos协议
同样是强一致性协议,Paxos在CAP三方面较之两阶段交协议要优秀得多。Paxos协议具有完全的C,较好的A,较好的 的A与P的属性与Quorum机制类似,因为Paxos的协议本身就具有Quorum机制的因素。
- 首先,无需赘述,Paxos协议是一种强一致性协议。
- 再者,Paxos协议只有两种情况下服务不可用:一是超过半数的Proposer异常,二是出现活锁。
- 前者可以通过增加Proposer的个数来降低由于Proposer异常影响服务的概率,后者本身发生的概率就极低。
- 最后,只要能与超过半数的Proposer通信就可以完成协议流程,协议本身具有较好的容忍网络分区的能力。