Consistency 一致性
一致性指“all nodes see the same data at the same time
”,即所有节点在同一时间的数据完全一致。
强一致性:系统中的某个数据被成功更新后,后续任何对该数据的读取操作都将立即得到更新后的值;
弱一致性:允许系统出现不一致的中间状态,及允许数据同步过程中存在延时。
最终一致性:经过一定时间最终能到达一致状态。
Availability 可用性
可用性指“Reads and writes always succeed
”,即服务在正常响应时间内一直可用。
Partition Tolerance分区容错性
分区容错性指“the system continues to operate despite arbitrary message loss or failure of part of the system
”,即分布式系统在遇到某节点或网络分区故障的时候,仍然能够对外提供满足一致性或可用性的服务。放弃分区容错性就放弃了系统的可扩展性。
CAP三者无法同时满足,因为是分布式系统,所以肯定有子网络,必须满足P,所以我们要在C(一致性)和P(可用性)之间做出权衡。
假设有五个节点:n1~n5 ,出现网络分区被分成两组:[n1~n2]和[n3~n5],那么当n1出来客户端请求时(为了处理这种情况,也就是说"容忍网络分区",即支持 P):
1:如果要保证C(一致性),那么它需要把消息复制到所有节点,但是网络分区导致无法成功复制到n3~n5,所以它只能返回"处理失败"的结果给客户端。(这时系统就处于不可用状态,即丧失了A)
2:如果要保证可用性A,那么n1就只能把消息复制到n2,而不用复制到n3~n5(或者无视复制失败/超时),但n3同时也可能在处理客户端请求(譬如对同一个值进行修改),n3也为了保证A而做了同样的处理。 那么 [n1~n2]和[n3~n5]的状态就不一致了,于是就丧失了 C。
那么如果不支持P(也就是不容忍网络分区),也就是说(很乐观的认为)假设系统不会出现网络分区