分布式事务

一杯冰美式&&

于 2023-04-10 20:30:55 发布

阅读量196

点赞数

分类专栏：微服务文章标签：分布式数据库 java

本文链接：https://blog.csdn.net/weixin_63739578/article/details/130065770

版权

微服务专栏收录该内容

7 篇文章 0 订阅

订阅专栏

事务

本地事务

本地事务，也就是传统的单机事务。在传统数据库事务中，必须要满足四个原则：在这里插入图片描述

分布式事务

分布式事务就是指事务的参与者、支持事务的服务器、资源服务器以及事务管理器分别位于不同的分布式系统的不同节点之上。简单的说，就是一次大的操作由不同的小操作组成，这些小的操作分布在不同的服务器上，且属于不同的应用，分布式事务需要保证这些小操作要么全部成功，要么全部失败。本质上来说，分布式事务就是为了保证不同数据存储的数据一致性。
产生原因
1、数据库分库分表
当数据库单表一年产生的数据超过1000W，那么就要考虑分库分表。这时候，如果一个操作既访问01库，又访问02库，而且要保证数据的一致性，那么就要用到分布式事务。在这里插入图片描述
2、服务SOA化
所谓的SOA化，就是业务的服务化。比如原来单机支撑了整个电商网站，现在对整个网站进行拆解，分离出了订单中心、用户中心、库存中心。对于订单中心，有专门的数据库存储订单信息，用户中心也有专门的数据库存储用户信息，库存中心也会有专门的数据库存储库存信息。这时候如果要同时对订单和库存进行操作，那么就会涉及到订单数据库和库存数据库，为了保证数据一致性，就需要用到分布式事务。在这里插入图片描述

分布式系统基础

从上面来看分布式事务是随着互联网高速发展应运而生的，传统的数据库的ACID四大特性，已经无法满足我们分布式事务，这个时候又有一些大佬提出一些新的理论。

CAP定理

1998年，加州大学的计算机科学家 Eric Brewer 提出，分布式系统有三个指标。
Consistency（一致性）
Availability（可用性）
Partition tolerance （分区容错性） 在这里插入图片描述
它们的第一个字母分别是 C、A、P。
Eric Brewer 说，这三个指标不可能同时做到。这个结论就叫做 CAP 定理。
Consistency（一致性）：用户访问分布式系统中的任意节点，得到的数据必须一致。
Availability （可用性）：用户访问集群中的任意健康节点，必须能得到响应，而不是超时或拒绝。
Partition（分区）：因为网络故障或其它原因导致分布式系统中的部分节点与其它节点失去连接，形成独立分区。
Tolerance（容错）：在集群出现分区时，整个系统也要持续对外提供服务
在分布式系统中，系统间的网络不能100%保证健康，一定会有故障的时候，而服务有必须对外保证服务。因此Partition Tolerance不可避免。

当节点接收到新的数据变更时，就会出现问题了：
在这里插入图片描述
如果此时要保证一致性，就必须等待网络恢复，完成数据同步后，整个集群才对外提供服务，服务处于阻塞状态，不可用。
如果此时要保证可用性，就不能等待网络恢复，那node01、node02与node03之间就会出现数据不一致。
也就是说，在P一定会出现的情况下，A和C之间只能实现一个。

BASE理论

BASE理论是对CAP的一种解决思路，包含三个思想：

Basically Available （基本可用）：分布式系统在出现故障时，允许损失部分可用性，即保证核心可用。
**Soft State（软状态）：**在一定时间内，允许出现中间状态，比如临时的不一致状态。
Eventually Consistent（最终一致性）：虽然无法保证强一致性，但是在软状态结束后，最终达到数据一致。

解决分布式事务的思路

分布式事务最大的问题是各个子事务的一致性问题，因此可以借鉴CAP定理和BASE理论，有两种解决思路：
1、AP模式：各子事务分别执行和提交，允许出现结果不一致，然后采用弥补措施恢复数据即可，实现最终一致。
2、CP模式：各个子事务执行后互相等待，同时提交，同时回滚，达成强一致。但事务等待过程中，处于弱可用状态。
但不管是哪一种模式，都需要在子系统事务之间互相通讯，协调事务状态，也就是需要一个事务协调者(TC)：
在这里插入图片描述
这里的子系统事务，称为分支事务；有关联的各个分支事务在一起称为全局事务。

Seata

Seata是 2019 年 1 月份蚂蚁金服和阿里巴巴共同开源的分布式事务解决方案。致力于提供高性能和简单易用的分布式事务服务，为用户打造一站式的分布式解决方案。
官网地址：Seata，其中的文档、播客中提供了大量的使用说明、源码分析。

微服务集成Seata

1、引入依赖

<!--seata-->
<dependency>
    <groupId>com.alibaba.cloud</groupId>
    <artifactId>spring-cloud-starter-alibaba-seata</artifactId>
    <exclusions>
        <!--版本较低，1.3.0，因此排除--> 
        <exclusion>
            <artifactId>seata-spring-boot-starter</artifactId>
            <groupId>io.seata</groupId>
        </exclusion>
    </exclusions>
</dependency>
<dependency>
    <groupId>io.seata</groupId>
    <artifactId>seata-spring-boot-starter</artifactId>
    <!--seata starter 采用1.4.2版本-->
    <version>${seata.version}</version>
</dependency>

2、配置TC地址
在微服务中的application.yml中，配置TC服务信息，通过注册中心nacos，结合服务名称获取TC地址：

seata:
  registry: # TC服务注册中心的配置，微服务根据这些信息去注册中心获取tc服务地址
    type: nacos # 注册中心类型 nacos
    nacos:
      server-addr: 127.0.0.1:8848 # nacos地址
      namespace: "" # namespace，默认为空
      group: DEFAULT_GROUP # 分组，默认是DEFAULT_GROUP
      application: seata-tc-server # seata服务名称
      username: nacos
      password: nacos
  tx-service-group: seata-demo # 事务组名称
  service:
    vgroup-mapping: # 事务组与cluster的映射关系
      seata-demo: SH

Seata的架构

Seata事务管理中有三个重要的角色：
TC (Transaction Coordinator) 事务协调者：维护全局和分支事务的状态，协调全局事务提交或回滚。

TM (Transaction Manager) 事务管理器：定义全局事务的范围、开始全局事务、提交或回滚全局事务。

RM (Resource Manager) 资源管理器：管理分支事务处理的资源，与TC交谈以注册分支事务和报告分支事务的状态，并驱动分支事务提交或回滚。
整体的架构如图：在这里插入图片描述
Seata基于上述架构提供了四种不同的分布式事务解决方案：

XA模式：

XA 规范是 X/Open 组织定义的分布式事务处理（DTP，Distributed Transaction Processing）标准，XA 规范描述了全局的TM与局部的RM之间的接口，几乎所有主流的数据库都对 XA 规范提供了支持。
两阶段提交
XA是规范，目前主流数据库都实现了这种规范，实现的原理都是基于两阶段提交。
正常情况：在这里插入图片描述
异常情况
一阶段：
1、事务协调者通知每个事物参与者执行本地事务
2、本地事务执行完成后报告事务执行状态给事务协调者，此时事务不提交，继续持有数据库锁
二阶段：
3、事务协调者基于一阶段的报告来判断下一步操作
3.1、如果一阶段都成功，则通知所有事务参与者，提交事务
3.2、如果一阶段任意一个参与者失败，则通知所有事务参与者回滚事务
Seata的XA模型
Seata对原始的XA模式做了简单的封装和改造，以适应自己的事务模型，基本架构如图：
在这里插入图片描述
RM一阶段的工作：
① 注册分支事务到TC
② 执行分支业务sql但不提交
③ 报告执行状态到TC
TC二阶段的工作：
TC检测各分支事务执行状态
a.如果都成功，通知所有RM提交事务
b.如果有失败，通知所有RM回滚事务
RM二阶段的工作：
接收TC指令，提交或回滚事务
优点：
1、事务的强一致性，满足ACID原则。
2、常用数据库都支持，实现简单，并且没有代码侵入
缺点：
1、因为一阶段需要锁定数据库资源，等待二阶段结束才释放，性能较差
2、依赖关系型数据库实现事务
特点： 强一致性分阶段事务模式，牺牲了一定的可用性，无业务侵入
实现步骤：
1、修改application.yml文件（每个参与事务的微服务），开启XA模式：

seata:
  data-source-proxy-mode: XA

2、给发起全局事务的入口方法添加@GlobalTransactional注解:
3、重启服务并测试

AT模式：

Seata的AT模型
基本流程图：在这里插入图片描述
阶段一RM的工作：
1、注册分支事务
2、记录undo-log（数据快照）
3、执行业务sql并提交
4、报告事务状态
阶段二提交时RM的工作：
1、删除undo-log即可
阶段二回滚时RM的工作：
1、根据undo-log恢复数据到更新前
AT与XA的区别
1、 XA模式一阶段不提交事务，锁定资源；AT模式一阶段直接提交，不锁定资源。
2、XA模式依赖数据库机制实现回滚；AT模式利用数据快照实现数据回滚。
3、XA模式强一致；AT模式最终一致
脏写问题
在多线程并发访问AT模式的分布式事务时，有可能出现脏写问题，如图：
在这里插入图片描述
解决思路：
就是引入了全局锁的概念。在释放DB锁之前，先拿到全局锁。避免同一时刻有另外一个事务来操作当前数据。

优点：
1、一阶段完成直接提交事务，释放数据库资源，性能比较好
2、利用全局锁实现读写隔离
3、没有代码侵入，框架自动完成回滚和提交
缺点：
1、两阶段之间属于软状态，属于最终一致
2、框架的快照功能会影响性能，但比XA模式要好很多
特点： 最终一致的分阶段事务模式，无业务侵入，也是Seata的默认模式

TCC模式：

TCC模式与AT模式非常相似，每阶段都是独立事务，不同的是TCC通过人工编码来实现数据恢复。需要实现三个方法：
1、Try：资源的检测和预留
2、Confirm：业务执行和提交
3、Cancel：预留资源释放
Seata的TCC模型
在这里插入图片描述
优点：
1、一阶段完成直接提交事务，释放数据库资源，性能好
2、相比AT模型，无需生成快照，无需使用全局锁，性能最强
3、不依赖数据库事务，而是依赖补偿操作，可以用于非事务型数据库
缺点：
1、有代码侵入，需要人为编写try、Confirm和Cancel接口，太麻烦
2、软状态，事务是最终一致
3、需要考虑Confirm和Cancel的失败情况，做好幂等处理
特点： 最终一致的分阶段事务模式，有业务侵入

tcc模式的问题
空回滚
如果try因为因为一些原因阻塞了,导致try没有执行超时了,TC会通知RM进行回滚,那么没有执行try的RM,就要进行空回滚
判断只没有执行过try,如果没有执行try,就不做真的回滚操作,在冻结资源表中存入该事务回滚的数据. 在这里插入图片描述
业务悬挂
对于已经空回滚的业务，之前被阻塞的try操作恢复，继续执行try，就永远不可能confirm或cancel ，事务一直处于中间状态，这就是业务悬挂。
执行try操作时，应当判断cancel是否已经执行过了，如果已经执行，应当阻止空回滚后的try操作，避免悬挂

SAGA模式：

在 Saga 模式下，分布式事务内有多个参与者，每一个参与者都是一个冲正补偿服务，需要用户根据业务场景实现其正向操作和逆向回滚操作。

分布式事务执行过程中，依次执行各参与者的正向操作，如果所有正向操作均执行成功，那么分布式事务提交。如果任何一个正向操作执行失败，那么分布式事务会去退回去执行前面各参与者的逆向回滚操作，回滚已提交的参与者，使分布式事务回到初始状态。在这里插入图片描述
Saga也分为两个阶段：
1、一阶段：直接提交本地事务
2、二阶段：成功则什么都不做；失败则通过编写补偿业务来回滚
优点：
1、事务参与者可以基于事件驱动实现异步调用，吞吐高
2、一阶段直接提交事务，无锁，性能好
3、不用编写TCC中的三个阶段，实现简单
缺点：
1、软状态持续时间不确定，时效性差
2、没有锁，没有事务隔离，会有脏写
特点： 长事务模式，有业务侵入