CAP原理
通常说一个分布式系统或者服务或者中间件,不能同时拥有这三个特性。它们只能两两组合。
分区容错性
尽管一个系统出现了数据的丢失或者故障,那么我们的系统仍然要对外提供正常的访问
如上图所示,一个结点挂掉不影响另一个结点对外提供服务,这是分区容错性非常重要的一个特征,也是分布式系统具备的基本能力。
一致性
all nodes see the same data at the same time
所有的结点在同一个时间看到的数据都是一样的。
- 由于数据同步的过程,写操作的响应会有一定的延迟。
- 为了保证数据的一致性,写操作对资源会进行暂时的锁定,待数据同步完成之后释放锁定资源,此时对数据库的所有操作会被阻塞。
- 保证一致性就会影响一定的吞吐量。
可用性
Reads and Writes always succeed
读和写在任何时候都要成功。
所有的请求都有响应,且不会出现响应超时或响应错误。
为什么只能两两组合
- 分布式系统的基础是分区容错性,所以P是基础需要保证的。
- 牺牲数据一致性(C),异步同步数据,响应旧的数据给用户,提高吞吐量,保证可用性,这就是AP。
- 牺牲可用性(A),阻塞等待,直到网络连接恢复,数据同步完之后,响应用户新数据,保证数据一致性,这就是CP。