数据库的CAP理论：一致性、可用性以及分区容忍性

东南门吹雪

已于 2023-04-15 11:02:31 修改

阅读量1.4k

点赞数

文章标签：数据库 CAP 分布式计算机科学理论

于 2023-04-14 11:13:52 首次发布

原文链接：https://www.bmc.com/blogs/cap-theorem/

版权

数据库的CAP理论：一致性、可用性以及分区容忍性

乔纳珊.约翰逊
2020.12.9

译者：东南门吹雪
2023.4.14

CAP理论是来自理论计算机科学关于分布式数据存储的一个信念，它断言：假如分布式数据库发生网络失败，则只能提供一致性、可用性二者之其中一项，而不是全部两者。
让我们一起来看下：
在这里插入图片描述

什么是CAP理论

CAP理论由3个部分组成（也是名字的由来）：

>一致性，全部读操作收到最新的写入或一个错误（error)。

>可用性，全部读都包含数据，但可能不是最新的。

>分区容忍性，即使网络失败（也就是失联的分区、慢网络连接，或节点间不可用的网络连接），系统也继续运转。

在正常的系统运转中，你的数据存储提供全部三项职能。但是CAP理论坚持认为：当分布式数据库经历网络失败时，你能提供要么一致性，要么可用性。

这是一个权衡。其它的全部时间里，三项是全部可以提供的。但是万一网络失败，则必须做出一个取舍。

在这个理论中，分区容忍性是必须的。其假设系统运行在分布式数据存储之上，所以系统天然伴随着网络分区而运转。网络分区会发生，所以为了提供任何类型的可靠服务，分区容忍性是必要的——CAP中的P。

然后剩下在C与A两者之间的决定。当网络失败发生时，人们可以选择保证一致性或者可用性：

>高一致性带来更低的可用性的代价

>高可用性带来更低的一致性的代价

在CAP中的一致性（Consistency）跟ACID中的一致性（Consistency）概念不同。CAP中的一致性表示有最时新的信息。（ACID指另一个不同的数据库事件。在ACID，一致性表示任何新的数据库事务不会破坏数据库的正确性）

用户查询：一致的或可用的

现在思考一下用户查询的问题。我们假定一个用户对一个数据库做一个查询，然后这个网络数据库要返回一个值。

无论从数据库返回哪个值，都依赖于我们是提供一致性还是可用性的选择。这里看下这种选择过程的来龙去脉：

>发生一个查询时，我们使用服务器上的当前值向用户响应，以提供一个高可用的服务。如果我们这样做，就不能保证返回的值是最新提交到数据库的。可能最新的写入还卡在某处的传输过程中。

>如果我们要保证高一致性，则我们不得不等待这个新的写入或者针对这次查询返回一个错误。因此，我们牺牲了可用性来确保查询返回的数据是一致的。