Seata 是什么?
Seata 是一款开源的分布式事务解决方案,致力于提供高性能和简单易用的分布式事务服务。Seata 将为用户提供了 AT、TCC、SAGA 和 XA 事务模式,为用户打造一站式的分布式解决方案。
AT 模式
前提
- 基于支持本地 ACID 事务的关系型数据库。
- Java 应用,通过 JDBC 访问数据库。
整体机制
两阶段提交协议的演变:
-
一阶段:业务数据和回滚日志记录在同一个本地事务中提交,释放本地锁和连接资源。
-
二阶段:
- 提交异步化,非常快速地完成。
- 回滚通过一阶段的回滚日志进行反向补偿。
写隔离
- 一阶段本地事务提交前,需要确保先拿到 全局锁 。
- 拿不到 全局锁 ,不能提交本地事务。
- 拿 全局锁 的尝试被限制在一定范围内,超出范围将放弃,并回滚本地事务,释放本地锁。
以一个示例来说明:
两个全局事务 tx1 和 tx2,分别对 a 表的 m 字段进行更新操作,m 的初始值 1000。
tx1 先开始,开启本地事务,拿到本地锁,更新操作 m = 1000 - 100 = 900。本地事务提交前,先拿到该记录的 全局锁 ,本地提交释放本地锁。 tx2 后开始,开启本地事务,拿到本地锁,更新操作 m = 900 - 100 = 800。本地事务提交前,尝试拿该记录的 全局锁 ,tx1 全局提交前,该记录的全局锁被 tx1 持有,tx2 需要重试等待 全局锁 。
tx1 二阶段全局提交,释放 全局锁 。tx2 拿到 全局锁 提交本地事务。
如果 tx1 的二阶段全局回滚,则 tx1 需要重新获取该数据的本地锁,进行反向补偿的更新操作,实现分支的回滚。
此时,如果 tx2 仍在等待该数据的 全局锁,同时持有本地锁,则 tx1 的分支回滚会失败。分支的回滚会一直重试,直到 tx2 的 全局锁 等锁超时,放弃 全局锁 并回滚本地事务释放本地锁,tx1 的分支回滚最终成功。
因为整个过程 全局锁 在 tx1 结束前一直是被 tx1 持有的,所以不会发生 脏写 的问题。
读隔离
在数据库本地事务隔离级别 读已提交(Read Committed) 或以上的基础上,Seata(AT 模式)的默认全局隔离级别是 读未提交(Read Uncommitted) 。
如果应用在特定场景下,必需要求全局的 读已提交 ,目前 Seata 的方式是通过 SELECT FOR UPDATE 语句的代理。
SELECT FOR UPDATE 语句的执行会申请 全局锁 ,如果 全局锁 被其他事务持有,则释放本地锁(回滚 SELECT FOR UPDATE 语句的本地执行)并重试。这个过程中,查询是被 block 住的,直到 全局锁 拿到,即读取的相关数据是 已提交 的,才返回。
出于总体性能上的考虑,Seata 目前的方案并没有对所有 SELECT 语句都进行代理,仅针对 FOR UPDATE 的 SELECT 语句。
工作机制
以一个示例来说明整个 AT 分支的工作过程。
业务表:product
Field | Type | Key |
---|---|---|
id | bigint(20) | PRI |
name | varchar(100) | |
since | varchar(100) |
AT 分支事务的业务逻辑:
update product set name = 'GTS' where name = 'TXC';
一阶段
过程:
- 解析 SQL:得到 SQL 的类型(UPDATE),表(product),条件(where name = 'TXC')等相关的信息。
- 查询前镜像:根据解析得到的条件信息,生成查询语句,定位数据。
select id, name, since from product where name = 'TXC';
得到前镜像:
id | name | since |
---|---|---|
1 | TXC | 2014 |
- 执行业务 SQL:更新这条记录的 name 为 'GTS'。
- 查询后镜像:根据前镜像的结果,通过 主键 定位数据。
select id, name, since from product where id = 1;
得到后镜像:
id | name | since |
---|---|---|
1 | GTS | 2014 |
- 插入回滚日志:把前后镜像数据以及业务 SQL 相关的信息组成一条回滚日志记录,插入到
UNDO_LOG
表中。
{
"branchId": 641789253,
"undoItems": [{
"afterImage": {
"rows": [{
"fields": [{
"name": "id",
"type": 4,
"value": 1
}, {
"name": "name",
"type": 12,
"value": "GTS"
}, {
"name": "since",
"type": 12,
"value": "2014"
}]
}],
"tableName": "product"
},
"beforeImage": {
"rows": [{
"fields": [{
"name": "id",
"type": 4,
"value": 1
}, {
"name": "name",
"type": 12,
"value": "TXC"
}, {
"name": "since",
"type": 12,
"value": "2014"
}]
}],
"tableName": "product"
},
"sqlType": "UPDATE"
}],
"xid": "xid:xxx"
}
- 提交前,向 TC 注册分支:申请
product
表中,主键值等于 1 的记录的 全局锁 。 - 本地事务提交:业务数据的更新和前面步骤中生成的 UNDO LOG 一并提交。
- 将本地事务提交的结果上报给 TC。
二阶段-回滚
- 收到 TC 的分支回滚请求,开启一个本地事务,执行如下操作。
- 通过 XID 和 Branch ID 查找到相应的 UNDO LOG 记录。
- 数据校验:拿 UNDO LOG 中的后镜与当前数据进行比较,如果有不同,说明数据被当前全局事务之外的动作做了修改。这种情况,需要根据配置策略来做处理,详细的说明在另外的文档中介绍。
- 根据 UNDO LOG 中的前镜像和业务 SQL 的相关信息生成并执行回滚的语句:
update product set name = 'TXC' where id = 1;
- 提交本地事务。并把本地事务的执行结果(即分支事务回滚的结果)上报给 TC。
二阶段-提交
- 收到 TC 的分支提交请求,把请求放入一个异步任务的队列中,马上返回提交成功的结果给 TC。
- 异步任务阶段的分支提交请求将异步和批量地删除相应 UNDO LOG 记录。
附录
回滚日志表
UNDO_LOG Table:不同数据库在类型上会略有差别。
以 MySQL 为例:
Field | Type |
---|---|
branch_id | bigint PK |
xid | varchar(100) |
context | varchar(128) |
rollback_info | longblob |
log_status | tinyint |
log_created | datetime |
log_modified | datetime |
-- 注意此处0.7.0+ 增加字段 context
CREATE TABLE `undo_log` (
`id` bigint(20) NOT NULL AUTO_INCREMENT,
`branch_id` bigint(20) NOT NULL,
`xid` varchar(100) NOT NULL,
`context` varchar(128) NOT NULL,
`rollback_info` longblob NOT NULL,
`log_status` int(11) NOT NULL,
`log_created` datetime NOT NULL,
`log_modified` datetime NOT NULL,
PRIMARY KEY (`id`),
UNIQUE KEY `ux_undo_log` (`xid`,`branch_id`)
) ENGINE=InnoDB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8;
TCC 模式
回顾总览中的描述:一个分布式的全局事务,整体是 两阶段提交 的模型。全局事务是由若干分支事务组成的,分支事务要满足 两阶段提交 的模型要求,即需要每个分支事务都具备自己的:
- 一阶段 prepare 行为
- 二阶段 commit 或 rollback 行为
根据两阶段行为模式的不同,我们将分支事务划分为 Automatic (Branch) Transaction Mode 和 Manual (Branch) Transaction Mode.
AT 模式(参考链接 TBD)基于 支持本地 ACID 事务 的 关系型数据库:
- 一阶段 prepare 行为:在本地事务中,一并提交业务数据更新和相应回滚日志记录。
- 二阶段 commit 行为:马上成功结束,自动 异步批量清理回滚日志。
- 二阶段 rollback 行为:通过回滚日志,自动 生成补偿操作,完成数据回滚。
相应的,TCC 模式,不依赖于底层数据资源的事务支持:
- 一阶段 prepare 行为:调用 自定义 的 prepare 逻辑。
- 二阶段 commit 行为:调用 自定义 的 commit 逻辑。
- 二阶段 rollback 行为:调用 自定义 的 rollback 逻辑。
所谓 TCC 模式,是指支持把 自定义 的分支事务纳入到全局事务的管理中。
Saga 模式
Saga模式是SEATA提供的长事务解决方案,在Saga模式中,业务流程中每个参与者都提交本地事务,当出现某一个参与者失败则补偿前面已经成功的参与者,一阶段正向服务和二阶段补偿服务都由业务开发实现。
理论基础:Hector & Kenneth 发表论⽂ Sagas (1987)
适用场景:
- 业务流程长、业务流程多
- 参与者包含其它公司或遗留系统服务,无法提供 TCC 模式要求的三个接口
优势:
- 一阶段提交本地事务,无锁,高性能
- 事件驱动架构,参与者可异步执行,高吞吐
- 补偿服务易于实现
缺点:
- 不保证隔离性(应对方案见用户文档)
开始实践操作
分布式一致性是分布式系统亟需解决的关键问题之一,根据过去一年的调查问卷,在微服务的实践中分布式事务是用户遇到的最大痛点。目前市面缺少经过洪荒流量验证的分布式事务组件,Seata 在阿里经济体内部经过了漫长的孵化,承载了双11洪荒流量,实践证明 Seata 是一款解决分布式数据一致性的的优秀组件。Seata 于 2019 年正式对外开源,开源后就受到了大家的热情追捧,一度蝉联 GitHub 活跃排名榜首。
Seata 除了提供了独创的 AT 事务模式外,还扩展了 TCC、Saga 和 XA 事务模式,满足大家对于不同业务场景中的需求。相关详细信息可参考其官网 Seata官网
本课程通过一个实际项目,体验和学习如何使用seata实现分布式事务。
tips 如果你完全没有接触过分布式事务,建议先学习一下分布式事务基础知识
2. 学习目标
- 学习在实际工程中如何使用 seata
- 访问应用,并观察分布式事务执行效果
3. 工程说明
本实验提供了3个工程,其调用关系如下:
如图所示,服务链路中包含三个微服务:business(微服务入口)、order(订单服务)和 storage(库存服务)。
业务逻辑
- 通过url 调用 business 服务,business 服务会通过 openFeign 的方式分别调用 storage 和 order 服务。
- 每个服务调用后会根据正常(ok)或异常(fail)的返回值决定是否抛出异常,若返回结果不为 ok 那么 business 将抛出异常,触发整个事务回滚,预期数据至 business 方法执行前的数据并且库存总量和与初始值一致。
- 当order 和 storage 两个服务调用正常,用户可以根据 url 中的 mockException=true 或 false 来注入一个 mock 异常,当注入异常后,期望数据回滚至 business 方法执行前的数据并且库存总量和与初始值一致。
异常逻辑
- 在 bussiness 中请求超过现有库存,通过参数 count 来指定要扣减的库存数量,当超出库存,将抛出异常进行事务回滚。
- 在 bussiness 中请求中加入 mockException=true 参数,触发事务回滚。
部署前的准备工作
下载此实例工程代码链接: https://pan.baidu.com/s/1i-rY7oVassvP2RchQiXaeg 密码: iaf3
1、下载实例代码并解压,目录如下:
drwxr-xr-x 3 shell shell 4096 Apr 2 02:47 business-service
drwxr-xr-x 3 shell shell 4096 Apr 2 02:47 common-service
-rw-r--r-- 1 shell shell 199 Apr 2 02:47 init-seata.sh
drwxr-xr-x 3 shell shell 4096 Apr 2 02:48 logs
-rw------- 1 shell shell 11098 Apr 2 02:48 nohup.out
drwxr-xr-x 3 shell shell 4096 Apr 2 02:47 order-service
-rw-r--r-- 1 shell shell 4614 Apr 2 02:47 pom.xml
drwxr-xr-x 5 shell shell 4096 Dec 10 15:35 seata
drwxr-xr-x 2 shell shell 4096 Apr 2 02:48 sessionStore
drwxr-xr-x 3 shell shell 4096 Apr 2 02:47 storage-service
2、运行init-seata.sh 脚本下载并启动seata服务
3、编译应用程序
4. 部署和启动
4.1. 编译应用
使用 maven 命令编译整个工程
mvn clean package
首次编译,预计需要2-3分钟
4.2. 启动应用
4.2.1.启动订单(order)服务
打开新tab(点我打开),并执行下面的命令:
java -jar order-service/target/order-service-0.0.1-SNAPSHOT.jar
等待应用启动,直到看到如下日志代表应用启动完成
......
Tomcat started on port(s): 8082 (http) with context path ''
Started OrderApplication in 12.938 seconds (JVM running for 14.396)
4.2.2.启动库存(storage)服务
打开新tab(点我打开),并执行下面的命令:
java -jar storage-service/target/storage-service-0.0.1-SNAPSHOT.jar
等待应用启动,直到看到如下日志代表应用启动完成
......
Tomcat started on port(s): 8082 (http) with context path ''
Started StorageApplication in 12.938 seconds (JVM running for 14.396)
4.2.3.启动业务(business)服务
打开新tab(点我打开),并执行下面的命令:
java -jar business-service/target/business-service-0.0.1-SNAPSHOT.jar
等待应用启动,直到看到如下日志代表应用启动完成
......
Tomcat started on port(s): 60000 (http) with context path ''
Started BusinessApplication in 11.26 seconds (JVM running for 12.703)
至此,所有应用启动工作全部完成,下面就开始访问并验证 seata 的事务性;
5. 访问应用
你可以通过如下几个链接来实现业务逻辑和异常场景的触发:
- 库存检查链接
- 正常链接
- 异常链接
在链接 2、3 中的参数:
- count 属性代表扣减库存的数量,当库存不足将触发事务回滚;
- mockException 属性代表是否触发业务异常,设置为true 会触发业务异常,并通过分布式事务实现回滚;
这里我们提供了几个场景:
- 检查=>正常=>检查
代表正常访问场景,初始100的库存,正常扣减5件后,库存95 - 检查=>异常=>检查
典型的异常场景,初始95的库存(上一步完成了扣减),希望再次扣减5件,但是发生了异常,导致食物全部回滚,库存依然是95件
6. 代码说明
6.1. 框架引入
在 spring 应用中,引入 seata 非常简单,只需要2步即可完成框架引入工作:
引入 spring cloud alibaba bom
如 根pom 中所示:
<dependencyManagement>
<dependencies>
<dependency>
<groupId>com.alibaba.cloud</groupId>
<artifactId>spring-cloud-alibaba-dependencies</artifactId>
<version>${alibaba.cloud.version}</version>
<type>pom</type>
<scope>import</scope>
</dependency>
</dependencies>
</dependencyManagement>
spring-cloud-alibaba-dependencies 中包含所有组件的版本声明,后续的以来引入共走都可以不在关心版本信息
引入spring-cloud-starter-alibaba-seata
如 business-service 的 pom 中所示:
<dependencies>
<dependency>
<groupId>com.alibaba.cloud</groupId>
<artifactId>spring-cloud-starter-alibaba-seata</artifactId>
</dependency>
</dependencies>
其中 com.alibaba.cloud:spring-cloud-starter-alibaba-seata 中包含了 io.seata:seata-spring-boot-starter 依赖。若于期望依赖 seata 的版本不一致,可手动排除重引入。
spring cloud alibaba 版本说明。
6.2. 框架配置
添加配置文件,如 business-service 的 application.yml 中所示:
seata:
enabled: true
application-id: business
tx-service-group: my_test_tx_group
config:
type: nacos
nacos:
namespace: "sandbox-seata"
serverAddr: 139.196.203.133:8848
group: SEATA_GROUP
username: xxx
password: xxx
registry:
type: nacos
nacos:
application: seata-server
serverAddr: 139.196.203.133:8848
group: SEATA_GROUP
namespace: "sandbox-seata"
username: xxx
password: xxx
具体配置项说明参考此处。
在所有业务库中创建 undo_log 表,不同的数据库类型脚本参考此处 ,示例中已自动完成创建。
6.3. 代码增加注解
在需要纳入分布式事务链路的入口service 方法(保证可使 Spring 切面生效的位置亦可)上添加 @GlobalTransactional 注解。
参考 BusinessServiceImpl.java 的 reduceStockAndCreateOrder 方法:
@Override
@GlobalTransactional(timeoutMills = 300000, name = "spring-cloud-alibaba-seata")
public void reduceStockAndCreateOrder(int count, boolean mockException) {
......
}
7. 其他