在数据库性能很难得到提升的时候,我们这个时候会选择将数据库进行分区,这种分区就是物理上的分区。分区之后不同的库可能就存在不同的服务器上,这种时候,事务的四大特性ACID:原子性,一致性,隔离性,持久性就不再适用。那么这个时候我们就要引入新的原则或则理论来适用于这种情况,那就是CAP原则或者叫做CAP理论。
CAP原则:web服务器无法同时满足以下三个属性:
一致性:每次读取要么获得最近写入的数据,要么获取到一个错误。
可用性:每次读取都能够获取到响应(非错误),即数据,但是不能保证数据是最近写入的最新的数据。
分区容错性:即使出现消息错误或者延迟,系统仍能正常运行。
且在网络分区的情况下,满足分区容错性,一致性和可用性只能够二选一。但是在没有网络分区的情况下,一致性和可用性是都可以满足的。即:
如果系统不允许写入,那么意味着降低了系统的可用性,但不同分区的数据能够保持一致,即选择了一致性。
如果系统允许写入,那么意味着不同分区之间的数据产生不一致,系统可用性得到保障,即选择可用性。
在分布式系统中,往往可用性比一致性更实用,如何实现高可用,那么就要说到BASE理论。
BASE理论:是对CAP原则的拓展。
基本可用:分布式系统出现了不可预知的故障时,允许损失部分可用性,响应时间合理延长,功能上适当做服务降级。
弱状态:允许系统中的数据存在中间状态,并认为该状态不影响系统的整体可用性,即允许系统在多个不同的节点数据副本存在数据延时。
最终一致性:上面说的弱状态,但是并不能一直弱状态,要有一个时间限制,在期限过后,还是要保持数据的一致性。这个时间期限取决与网络延时,系统负载,数据复制方案设计等。
最终一致性分为五种:
1、因果一致性:如果节点A更新了数据之后,通知了节点B,那么节点B之后所访问的数据,都是基于节点A更新之后的数据。而和节点A没有因果关系的节点C访问到的数据,则不会基于节点A更新之后的数据。
2、读己之所写:节点A在进行更新操作之后,他自身所访问的总是已经更新过的最新值,而不会看到旧值,其实这也算是一种因果一致性。
3、会话一致性:在一次有效会话中,客户端总是能够获取到已经更新后的最新值。
4、单调读一致性:如果一个节点从系统中读到一个数据的某个值之后,那么系统对于该节点之后的任何节点所读到的该数据的值,都不能返回比这个值更旧的值。
5、单调写一致性:一个系统要能够保证来自同一个节点的写操作被顺序的执行。
这五种系统往往会结合使用,以构建一个具有最终一致性的分布式系统。
总的来说,BASE 理论面向的是大型高可用可扩展的分布式系统,和传统事务的 ACID 是相反的,它完全不同于 ACID 的强一致性模型,而是通过牺牲强一致性来获得可用性,并允许数据在一段时间是不一致的。
base是对cap中一致性和可用性的权衡的结果。核心思想是即使无法做到强一致性,但是每个应用根据自身的业务特点,采用适当的方式来使系统达到最终与执行。