CAP理论已经被讨论过无数次了,其实理解起来并不难,但要深入理解它的本质却不是一件容易的事情。我先用大白话简单的描述。
假设有一个分布式的服务端系统,它由N个服务器组成。正常情况下,任何两个服务器都可以相互通信。忽然间,这个系统被割裂成两个部分Pa和Pb,这两部分之间无法通信了,但是客户端仍然可以访问Pa或Pb中的任一服务器。
假设服务端系统中的每台服务器都有一个变量x的副本,起初x=0。如果客户端C1访问Pa并试图令变量x=1,那么Pb上的副本肯定还是0。如果另一个客户端C2去访问服务端Pb读取x,得到的必然还是0。可是从客户端看来,C1明明已经先把x从0变成1了,而后进行的C2读到的x还是0,这就是不满足一致性(Consistency)。——这说明,你在CAP中选择了A(可用性)和P(分区容忍性),即你选择了“让服务端在系统分裂的情况下继续工作,但不保证数据的一致性”。
如果你强烈要求一致性,那么就只能等到Pa和Pb可以互相通信,并且把所有的服务器上的x都赋值为1,C1操作才能算完成。——这说明,你在CAP中选择了C和P,即一旦出现分区隔离(P),宁可系统变得不可用(A),也要保证一致性(C)。
如果可用性和一致性你都想要,那么你只能想尽一切办法让系统不要分裂成Pa和Pb。——这说明,你放弃了P,即不允许系统会分裂。
所以,CAP理论可以用另一种更好的方式表述:如果出现系统分裂(P),你只能在可用性(A)和一致性(C)之间选一个。