CAP小结
本文是对CAP原理的简介、证明以及思考。其中理论证明部分主要来自于对Gilbert与Lynch的两篇论文(《Brewer’s Conjecture and the Feasibility of Consistent, Available, Partition-Tolerant Web Services》 和 《Perspectives on the CAP Theorem》)的理解。
CAP原理简介
CAP是一致性(Consistency)、可用性(Availability)以及分区容忍性(Partition Tolerance)的首字母缩写,而CAP原理要说明的是,针对这三种特性,一个分布式系统,同时只能满足两个。在分布式环境中,系统大都通过网络链接,彼此之间存在分区,所以分区容忍性往往是所处的现实基础,这个原理也可以这么说,在一个容易出现错误的分布式环境中,无法同时满足一致性和可用性。
![](https://i-blog.csdnimg.cn/blog_migrate/a099b372bf0212908554f7f0650c1be0.png)
由于三者不可得兼,而分区容忍性无法避免,所以业界既有很多CP和AP选择的分布式系统,比如:BASE思想(所谓软状态,最终一致性)就是AP的一种成功实践。
针对三种特性,分别做一些解释。
一致性(Consistency),表示分布式系统的不同分区的数据副本之间是一致的,这么定义有些严格,宽泛的讲,从外部请求这个分布式系统,能够有一致的存取和访问结果,先进行存储,后进行读取能够读到最新的值。如果由于分区的存在,导致分区之间数据不一致,这样一致性就无法兑现,但通过数据同步使得数据在一段延迟后重新一致,这种情况可以称之为最终一致性或者瞬时不一致。
可用性(Avaiability),表示分布式系统在任何时刻都能够提供服务的能力。如果分布式系统能够在理论上满足任何时刻可以提供服务,那么这个分布式系统具备良好的可用性。如果由于分区的存在,导致系统从整体上看,有稳定性风险,那么该分布式系统的可用性是不足的。
分区容忍性(Partition Tolerance),表示分布式系统多个分区(或者副本)之间能够封闭运行,可以在一个分区出现通信问题或者分区之间存在通信问题的情况下,系统对外表现工作良好。如果一个分布式系统,能够在分区或者分区之间通信不稳定的情况下稳定工作,那么表明该系统具备良好的分区容忍性。