分布式事务

最新推荐文章于 2024-06-02 15:45:37 发布

霜雪回眸

最新推荐文章于 2024-06-02 15:45:37 发布

阅读量777

点赞数 1

分类专栏：分布式事务文章标签： docker linux java

本文链接：https://blog.csdn.net/qq_44306975/article/details/121437906

版权

分布式事务专栏收录该内容

1 篇文章 0 订阅

订阅专栏

分布式事务

本地事务在分布式系统中，只能控制住自己的回滚，控制不了其他服务的回滚。主要发生在远程调用，本地事务解决不了让远程事务也回滚，顶多就自己回滚了。

而对分布式事务来说，出现的最主要原因就是网络问题和分布式机器。

本地事务

事务的基本性质

数据库事务的几个特性：原子性（Atomicity）、一致性（Consistency）、隔离性（Isolation）和持久性（Durability），简称就是 ACID。

原子性：一系列的操作整体不可拆分，要么同时成功，要么同时失败；
一致性：数据在事务的前后，业务整体一致；

隔离性：事务之间互相隔离；
持久性：一旦事务成功，数据一定会落盘在数据库。

事务的隔离级别

READ UNCOMMITTED（读未提交）：该隔离级别的事务会读到其它未提交事务的数据，此现象也称之为脏读。
READ COMMITTED（读提交）：一个事务可以读取另一个已提交的事务，多次读取会造成不一样的结果，此现象称为不可重复读问题，Oracle 和 SQL Server 的默认隔离级别。

REPEATABLE READ（可重复读）：该隔离级别是 MySQL 默认的隔离级别，在同一个事务里，select 的结果是事务开始时时间点的状态，因此，同样的 select 操作读到的结果会是一致的，但是，会有幻读现象。MySQL的 InnoDB 引擎可以通过 next-key locks 机制（参考下文"行锁的算法"一节）来避免幻读。
SERIALIZABLE（序列化）：在该隔离级别下事务都是串行顺序执行的，MySQL 数据库的 InnoDB 引擎会给读操作隐式加一把读共享锁，从而避免了脏读、不可重读复读和幻读问题。

事务的传播级别

PROPAGATION_REQUIRED：：如果当前没有事务，就创建一个新事务，如果当前存在事务，就加入该事务，该设置是最常用的设置。
PROPAGATION_SUPPORTS：：支持当前事务，如果当前存在事务，就加入该事务，如果当前不存在事务，就以非事务执行。

PROPAGATION_MANDATORY：：支持当前事务，如果当前存在事务，就加入该事务，如果当前不存在事务，就抛出异常。
PROPAGATION_REQUIRES_NEW：创建新事务，无论当前存不存在事务，都创建新事务。

PROPAGATION_NOT_SUPPORTED：以非事务方式执行操作，如果当前存在事务，就把当前事务挂起。
PROPAGATION_NEVER：以非事务方式执行，如果当前存在事务，则抛出异常。

PROPAGATION_NESTED：如果当前存在事务，则在嵌套事务内执行。如果当前没有事务，则执行与 PROPAGATION_REQUIRED 类似的操作。

SpringBoot 事务关键点

1. 事务的自动配置

@TransactionAutoConfiguration

2. 事务的坑

在同一个类里面，编写两个方法，内部调用的时候，会导致事务设置失效。原因是没有用到代理对象的缘故。举个例子，在同一个service中有两个方法，他们都标注了事务注解，只是事务的传播机制不同，无论你是第一个调用第二个，还是第二个调用第一个，被调用的事务都是失效的，想要解决同一个service中事务的传播级别能够实现，就要使用aop做代理，这样才能实现在同一个service中事务能够调用，传播行为也能够实现。

解决：

导入 spring-boot-starter-aop依赖
启动类开启注解，使aop代理事务
@EnableTransactionManagement(proxyTargetClass = true)
方法上添加注解：@EnableAspectJAutoProxy(exposeProxy=true)
使用aop的方法：AopContext.currentProxy() 调用方法

分布式事务

1. 为什么有分布式事务？

分布式系统经常出现的异常：机器宕机、网络异常、消息丢失、消息乱序、数据错误、不可靠的 TCP、存储数据丢失...

分布式事务是企业集成中的一个技术难点，也是每一个分布式系统架构中都会涉及到的一个东西，特别是在微服务架构中，几乎可以说是无法避免。

2. CAP 定理与 BASE 理论

2.1. CAP 定理

CAP 原则又称 CAP 定理，指的是在一个分布式系统中

一致性（Consistency）：在分布式系统中的所有数据备份，在同一时刻是否同样的值。（等同于所有节点访问同一份最新的数据副本）
可用性（Availability）：在集群中一部分节点故障后，集群整体是否还能响应客户端的读写请求。（对数据更新具备高可用性）

分区容错性（Partition tolerance）：大多数分布式系统都分布在多个子网络。每个子网络就叫做一个区（partition）。分区容错的意思是，区间通信可能失败。比如，一台服务器放在中国，另一台服务器放在美国，这就是两个区，它们之间可能无法通信。

CAP 原则指的是，这三个要素最多只能同时实现两点，不可能三者兼顾。

一般来说，分区容错无法避免，因此可以认为 CAP 的 P 总是成立。CAP 定理告诉我们，剩下的 C 和 A 无法同时做到。

分布式系统中实现一致性的 raft 算法、paxos

Raft

给大家通俗的说一下为什么，CAP定理中P，也就是分区容错性一定要保证：假设有三台服务器，分别在三个机房。他们就是上面的主从复制关系，机房之间出现网络短路那很正常吧，如果出现了，有一台服务器连接不上其他服务器进行消息交换了，但是它对外界来说服务器还是能用的，只是和其他机房的连接断了，这时候随着时间的推移，这台服务器的消息肯定不是最新的了。这时候项目已经上线了，现在就有个选择为了使服务器的消息是最新的，保证消息一致性，你就只能把这个服务停了，这是不是白白浪费了一台服务器。这样就保证了CA，但是这样肯定不行，我们还有更好的方案，我们可以在代码方面设置消息的验证去保证一致性而不是直接牺牲一台服务器。在实际使用过程中我们可以选择保证CP或者AP但是不能把P丢掉。

2.2. 面临的问题

对于多数大型互联网应用的场景，主机众多、部署分散，而且现在的集群规模越来越大，所以节点故障、网络故障是常态，而且要保证服务可用性达到 99.99999%（N 个 9），即保证P 和 A，舍弃 C。

2.3. BASE 理论

BASE 理论是对 CAP 理论的延伸，思想是即使无法做到强一致性（CAP 的一致性就是强一致性），但可以采用适当的采取弱一致性，即 最终一致性。

BASE 是指

基本可用（Basically Available）

- 基本可用是指分布式系统在出现故障的时候，允许损失部分可用性（例如响应时间、功能上的可用性），允许损失部分可用性。需要注意的是，基本可用绝不等价于系统不可用。

- - 响应时间上的损失：正常情况下搜索引擎需要在 0.5 秒之内返回给用户相应的查询结果，但由于出现故障（比如系统部分机房发生断电或断网故障），查询结果的响应时间增加到了 1~2 秒。
  - 功能上的损失：购物网站在购物高峰（如双十一）时，为了保护系统的稳定性，部分消费者可能会被引导到一个降级页面。

软状态（ Soft State）

- 软状态是指允许系统存在中间状态，而该中间状态不会影响系统整体可用性。分布式存储中一般一份数据会有多个副本，允许不同副本同步的延时就是软状态的体现。mysql replication 的异步复制也是一种体现。

最终一致性（ Eventual Consistency）

- 最终一致性是指系统中的所有数据副本经过一定时间后，最终能够达到一致的状态。弱一致性和强一致性相反，最终一致性是弱一致性的一种特殊情况。

2.4. 强一致性、弱一致性、最终一致性

从客户端角度，多进程并发访问时，更新过的数据在不同进程如何获取的不同策略，决定了不同的一致性。对于关系型数据库，要求更新过的数据能被后续的访问都能看到，这是 强一致性。如果能容忍后续的部分或者全部访问不到，则是 弱一致性。如果经过一段时间后要求能访问到更新后的数据，则是 最终一致性。

3. 分布式事务的几种方案

3.1. 2PC 模式

数据库支持的 2PC【2 phase commit 二阶提交】，又叫做 XA Transactions。

MySQL 从 5.5 版本开始支持，SQL Server 2005 开始支持，Oracle 7 开始支持。其中，XA 是一个两阶段提交协议，该协议分为以下两个阶段：

第一阶段：事务协调器要求每个涉及到事务的数据库预提交(precommit)此操作，并反映是否可以提交。

第二阶段：事务协调器要求每个数据库提交数据。

其中，如果有任何一个数据库否决此次提交，那么所有数据库都会被要求回滚它们在此事务中的那部分信息。

XA 协议比较简单，而且一旦商业数据库实现了 XA 协议，使用分布式事务的成本也比较低。
XA 性能不理想，特别是在交易下单链路，往往并发量很高，XA 无法满足高并发场景

XA 目前在商业数据库支持的比较理想，在在 mysql 数据库中支持的不太理想，mysql 的XA 实现，没有记录 prepare 阶段日志，主备切换回导致主库与备库数据不一致。
许多 nosql 也没有支持 XA，这让 XA 的应用场景变得非常狭隘。

也有 3PC，引入了超时机制（无论协调者还是参与者，在向对方发送请求后，若长时间未收到回应则做出相应处理）

3.2. 柔性事务-TCC

刚性事务：遵循 ACID 原则，强一致性。

柔性事务：遵循 BASE 理论，最终一致性；

与刚性事务不同，柔性事务允许一定时间内，不同节点的数据不一致，但要求最终一致。

一阶段 prepare 行为：调用自定义的 prepare 逻辑。

二阶段 commit 行为：调用自定义的 commit 逻辑。

二阶段 rollback 行为：调用自定义的 rollback 逻辑。

所谓 TCC 模式，是指支持把自定义的分支事务纳入到全局事务的管理中。

3.3. 柔性事务-最大努力通知型方案

按规律进行通知，不保证数据一定能通知成功，但会提供可查询操作接口进行核对。这种方案主要用在与第三方系统通讯时，比如：调用微信或支付宝支付后的支付结果通知。这种方案也是结合 MQ 进行实现，例如：通过 MQ 发送 http 请求，设置最大通知次数。达到通知次数后即不再通知。

案例：银行通知、商户通知等（各大交易业务平台间的商户通知：多次通知、查询校对、对账文件），支付宝的支付成功异步回调。

3.4. 柔性事务-可靠消息 + 最终一致性方案（异步确保型）

实现：业务处理服务在业务事务提交之前，向实时消息服务请求发送消息，实时消息服务只记录消息数据，而不是真正的发送。业务处理服务在业务事务提交之后，向实时消息服务确认发送。只有在得到确认发送指令后，实时消息服务才会真正发送。

防止消息丢失：

做好消息确认机制（ pulisher ， consumer 【手动 ack 】）
每一个发送的消息都在数据库做好记录。定期将失败的消息再次发送一遍.

CREATE TABLE `mq_message` ( `message_id` char(32) NOT NULL, `content` text, `to_exchane` varchar(255) DEFAULT NULL, 
`routing_key` varchar(255) DEFAULT NULL, `class_type` varchar(255) DEFAULT NULL, `message_status` int(1) DEFAULT '0' COMMENT '0-新建 1-已发送 2-错误抵达 3-已抵达', 
`create_time` datetime DEFAULT NULL, 
`update_time` datetime DEFAULT NULL, PRIMARY KEY (`message_id`) ) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4