分布式事务与CAP理论解析-CSDN博客

本文链接：https://blog.csdn.net/m0_49374492/article/details/121346325

基础概念

什么是事务

事务可以看作是一次大的活动，它由不同的小活动组成，这些活动要么全部成功，要么全不失败

本地事务

在计算机系统中，更多的是通过关系型数据库来控制事务，这是利用数据库本身的事务特性来实现的，因此叫做数据库事务，由于应用主要靠关系数据库来控制事务，而数据库通常和应用在同一个服务器，所以基于关系型数据库的事务又被称为本地事务

数据的四大特性(ACID)：

A(atomic):原子性，构成事务的所有操作要么都执行完成，要么全部不执行，不可能出现部分成功部分失败的情况

C(consistency):一致性，在事务执行前后，数据库的一致性约束没有被破坏

I(isolation):隔离性，数据库中的事务一般都是并发的，隔离性是指并发的两个事务的执行互不干扰，一个事务不能看到其他事务运行过程中间状态。通过配置事务的隔离级别，可以避免脏读、重复读等问题

D(durability):持久性，事务完成之后，该事务对数据的更改会被持久化到数据库，且不会被回滚

数据库事务在实现时会将一次事务涉及的所有操作全部纳入到一个不可分割的执行单元，该执行单元中的所有操作要么都成功，要么都失败，只要其中任一操作执行失败，都将导致整个事务回滚

分布式事务

随着互联网的发展，软件系统由原来的单体应用转变为分布式应用：
在这里插入图片描述
分布式系统会把一个应用系统拆分为可独立部署的多个服务，因此需要服务与服务之间远程协作才能完成事务操作，这种分布式系统环境下由不同的服务之间通过网络远程协作完成事物操作称之为分布式事务

例如：用户注册即送积分的系统，积分系统要通过rpc框架远程调用，但是网络等因素又是不可控的，要实现注册和积分增加这一事务，就需要分布式事务

分布式事务产生场景

典型的就是微服务架构
单体系统访问多个数据库实例

当单体系统需要访问多个数据库(实例)时就会产生分布式事务

比如：用户信息和订单信息分别在mysql实例存储，用户管理系统删除用户信息，需要分别删除用户信息及用户的订单信息，由于数据分布在不同的数据实例，需要不同的数据库链接去操作数据，此时产生分布式事务
多服务访问同一个数据库实例

比如：订单微服务和库存微服务即使访问同一个数据库也会产生分布式事务，原因就是跨jvm进程，两个微服务持有了不同数据库链接进行数据库操作，此时产生分布式事务

分布式事务基础理论

CAP理论

CAP是consistency、availability、partition tolerance三个词语的缩写，分别表示一致性、可用性、分区容错性

拿以下电商系统的一些业务场景来理解cap
在这里插入图片描述
整体执行流程如下：

商品服务请求主数据库写入商品信息(添加商品、修改商品、删除商品)
主数据库向商品服务响应写入成功
商品服务请求从数据库读取商品信息

C-一致性

一致性是指写操作后的读取操作可以读取到最新的数据状态，当数据分布在多个节点上，从任意节点读取到的数据都是最新的状态

一致性是指写操作后的读操作可以读取到最新的数据状态，当数据分布在多个节点上，从任意节点读取到的数据都是最新的状态

上图中，商品信息的读写要满足一致性就要实现如下目标

商品服务写入主数据库成功，则向从数据库查询新数据也成功
商品服务写入主数据库失败，则向从数据库查询新数据也失败

如何实现一致性？

写入主数据库后要将数据同步到从数据库
写入主数据库后，在向从数据库同步期间要将从数据库锁定，待同步完成之后再释放锁，以免在新数据写入成功后，向从数据库查询到旧的数据

分布式系统一致性的特点

由于存在数据同步的过程，写操作的响应会有一定的延迟
为了保证数据的一致性会对资源暂时锁定，待数据同步完成释放锁定资源

A-可用性

可用性是指任何事物操作都可以得到响应结果，且不会出现响应超时或者响应错误

上图中，商品信息读取满足可用性就是要实现如下目标：

从数据库接收到数据查询的请求立即能够响应数据查询结果
从数据库不允许出现响应超时或者响应错误

如何实现可用性？

写入主数据库后要将数据同步到从数据库
由于要保证数据库的可用性，不可将从数据库中的资源进行锁定
即使数据还没有同步过来，从数据库也要返回要查询的数据，哪怕是旧数据，如果连旧数据也没有则可以按照约定返回一个默认信息，但不能返回错误或者响应超时

分布式可用性的特点：

所有请求都有响应，且不会出现响应超时或响应错误

P-partition tolerance

通常分布式系统的各个节点部署在不同的子网，这就是网络分区，不可避免的会出现由于网络问题而导致节点之间的通信失败，此时仍可以对外提供服务，这叫做分区容忍性

上图中，商品信息读写满足分区容忍性就要实现如下目标：

主数据库向从数据库同步数据失败不影响读写操作
其中一个节点挂掉，不影响另一个节点对外提供服务

如何实现分区容忍性？

尽量使用异步取代同步操作，例如使用异步方法将数据从主数据库同步到从数据，这样节点之间就能有效的实现松耦合
添加从数据库节点，其中一个从节点挂掉其他从节点提供服务

分区容忍性的特点：

分区容错性是分布式系统具备的基本能力

CAP组合方式

在所有分布式事务场景中不会同时具备cap三个特性，因为在具备了p的前提下c和a是不能共存的

上图中分区容错性的含义是：

主数据库通过网络向从数据同步数据，可以认为主从数据库部署在不同的分区，通过网络进行交互
当主数据库从数据库之间的网络出现问题不影响主数据库和从数据库对外提供服务
其一个节点挂掉不影响另一个节点对外提供服务

如果要实现c则必须保证一致性性，在数据同步的时候为防止向数据库查询不一致的数据则需要将从数据库数据锁定，等待同步完成后解锁，如果同步失败从数据库要返回错误信息或超时信息

如果要实现a则要保证可用性，不管任何时候我去从数据库查询数据，都不会响应超时或者返回错误信息

综上所述在满足p的前提下c和a存在矛盾性

组合方式

放弃一致性，追求分区容忍性和可用性。这是很多分布式系统设计时的选择

例如：

上边的商品管理，完全可以实现ap，前提是只要用户可以接受所查询的数据在一定时间内不是最新的即可

cp

放弃可用性，追求一致性和分区容错性，比如跨行转账，一次转账请求要等待双方银行都完成整个系统才算完成

总结

cap是一个已经被证实的理论：一个分布式系统最多只能同时满足一致性、可用性和分区容错性这三项中的两项。

对于多数大型互联网应用的场景，节点众多、部署分散，而且现在的集群规模越来越大，所以节点故障、网络故障是常态，而且要保障服务可用性很高，并且要达到良好的响应性能来提高用户体验，因此一般都会做出如下选择：保证p和a，舍弃强一致性，保证最终一致性

Base理论

理解强一致性和最终一致性

cap理论告诉我们一个分布式系统中最多同时满足一致性、可用性和分区容忍性这三项中的两项，其中ap在实际应用中较多，ap即舍弃一致性，保证可用性和分区容忍性，但是在实际生产中很多场景都要实现一致性，比如前边主数据库向从数据库同步数据，即使不要一致性，但是最终也要将数据同步来保证数据的一致性，这种一致性和cap中的一致性不同，cap中的一致性要求在任何时间查询每个节点都必须一致，它强调的是强一致性，但是最终一致性是允许可以在一段时间内每个节点的数据不一致，但是经过一段时间每个节点的数据必须一致，它强调的是最终数据的一致性

base理论

base理论是对cap中ap的一个扩展，通过牺牲强一致性来获得可用性，当出现故障允许出现部分不可用但要保证核心功能可用，允许数据在一段时间内是不一致的，但最终达到一致状态，满足base理论的事务，我们称之为柔性事务

基本可用(basically available)：分布式系统出现故障的时候，允许损失部分可用功能，保证核心功能可用。如电商交易付款出现问题了，商品依旧可以正常浏览
软状态(soft state)：由于不要求强一致性，所以base允许系统中存在中间状态(也叫软状态)，这个状态不影响系统可用性，如订单的支付中、数据同步中等的状态，待数据最终一致后状态改为成功状态
最终一致：最终一致是指经过一段时间后，所有节点数据将会达到一致，如订单中的支付中状态，最终都会变为支付成功或者支付失败，使订单状态与实际交易结果达成一致，但需要一定时间的延迟、等待