什么是分布式事务?银行跨行转账业务是一个典型分布式事务场景,假设A需要跨行转账给B,那么就涉及两个银行的数据,无法通过一个数据库的本地事务保证转账的ACID,只能够通过分布式事务来解决。
分布式事务就是指事务的发起者、资源及资源管理器和事务协调者分别位于分布式系统的不同节点之上。在上述转账的业务中,用户A-100操作和用户B+100操作不是位于同一个节点上。本质上来说,分布式事务就是为了保证在分布式场景下,数据操作的正确执行。
什么是TCC分布式事务,TCC是Try、Confirm、Cancel三个词语的缩写,最早是由 Pat Helland 于 2007 年发表的一篇名为《Life beyond Distributed Transactions:an Apostate’s Opinion》的论文提出。
TCC组成
TCC分为3个阶段
- Try 阶段:尝试执行,完成所有业务检查(一致性), 预留必须业务资源(准隔离性)
- Confirm 阶段:如果所有分支的Try都成功了,则走到Confirm阶段。Confirm真正执行业务,不作任何业务检查,只使用 Try 阶段预留的业务资源
- Cancel 阶段:如果所有分支的Try有一个失败了,则走到Cancel阶段。Cancel释放 Try 阶段预留的业务资源。
TCC分布式事务里,有3个角色,与经典的XA分布式事务一样:
- AP/应用程序,发起全局事务,定义全局事务包含哪些事务分支
- RM/资源管理器,负责分支事务各项资源的管理
- TM/事务管理器,负责协调全局事务的正确执行,包括Confirm,Cancel的执行,并处理网络异常
如果我们要进行一个类似于银行跨行转账的业务,转出(TransOut)和转入(TransIn)分别在不同的微服务里,一个成功完成的TCC事务典型的时序图如下:
TCC实践
下面我们进行一个TCC事务的具体开发
目前可用于TCC的开源框架,主要为Java语言,其中以seata为代表。我们的例子采用python,使用的分布式事务框架为dtm,它对分布式事务的支持非常优雅。下面来详细讲解TCC的组成
下面我们来编写具体的Try/Confirm/Cancel的处理函数
@app.post("/api/TransOutTry")
def trans_out_try():
return {
"dtm_result": "SUCCESS"}
@app