分布式事务

祝所有的coder节日快乐

今天简单介绍下什么是分布式事务

问题分析

根据自动选课(就是说在在网上买课学习,支付订单后然后讲你的课程添加到你的学习课程中去,这里面涉及到了两个服务,一个是订单服务,一个是学习服务,而且整个系统是分布式系统,里面包含多个服务)的需求,分析下
用户支付完成后会将支付状态及订单状态保存到数据库中,由订单服务去维护订单数据库,而学生选课信息在学习中心数据库,由学习服务去维护学习中心数据库的信息,下图是系统结构图:
在这里插入图片描述
如何实现两个分布式服务(订单服务,学习服务)共同完成一件事即订单支付成功自动添加学生选课的雪球,这里的关键是如何保证两个分布式服务的事务的一致性。
尝试解决上边的需求,在订单服务中远程调用选课借口,伪代码如下:

订单支付结果通知方法{
	更新支付表中支付状态为“成功”。
	远程调用选课接口添加选课记录。
}

上边的逻辑说明:

  1. 更新支付表支付状态为本地数据库操作
  2. 远程调用选课接口为网络远程调用请求
  3. 为保存事务上边两步操作由spring控制事务,当遇到Exception异常则回滚本地数据库操作

出现的问题:

  1. 如果更新支付表失败则抛出异常,不再执行远程调用,此设想没有问题。
  2. 如果更新支付成功,远程调用超时会拉长本地数据库事务时间,影响数据库性能。
  3. 如果更新支付表成功,远程调用添加选课成功(选课数据库commit成功),最后更新支付表commit失败,此时出现操作不一致。

上边的问题涉及到分布式事务控制。

什么是分布式事务

什么是分布式系统

部署在不同节点上的系统通过网络交互来完成系统工作的系统
比如说:充值加积分的业务,用户在充值系统中向自己的账户充钱,在积分系统中自己积分相应的增加。充值系统和积分系统是两个不同的系统,一次充值加积分的业务就需要这两个系统系统工作来完成。

什么是事务

事务是指一组操作组成的一个工作单元,这个单元就有原子性(atomicity)、一致性(consistency)、隔离性(isolation)、和持久性(durability)。
原子性:执行单元的操作要么全部执行成功,要么全部失败。如果一部分成功一部分失败,那么成功的操作要全部回滚到执行前的状态。
一致性:执行一次事务会使数据要一个正确的状态转换到另一个正确的状态,执行前后数据是完整的。
隔离性:在该事务执行的过程中,任何数据的改变只存在于该事务中,对外界没有影响,事务与事务之间是完全隔离的。只有事务提交后其他事务才可以查询到最新的数据。
持久性:事务完成之后对数据的更改会永久的存储起来,即使发生断电宕机数据依然存在。

是么是本地事务

本地事务就是用关系型数据库来控制事务,关系型数据库通常具有ACID特性,传统的单体应用通常会将数据全部存储在一个数据库中,会借助关系型数据库来完成事务控制。

什么是分布式事务

在分布式系统中一次操作由多个系统协同完成,这种一次事务涉及多个系统通过网络协同工作来完成的过程称为分布式事务,这里强调的是多个系统通过网络协同完成一个事务的过程,并不强调多个系统访问了不同的数据库,即使多个系统访问的是同一个数据库也是分布式事务,如下图:
在这里插入图片描述
另外一种分布式事务的表现是,一个应用程序使用了多个数据源连接了不同的数据库,当一次事务需要操作多个数据源,此时也属于分布式事务,当系统操作了数据库拆分后出现此种情况
在这里插入图片描述
上面两种事务表现形式第一种居多。

分布式事务有哪些场景
  1. 电商系统中的下单减库存
    电商系统中,订单系统和库存系统是两个系统,一次下单的操作由两个系统协同完成
  2. 金融系统中的银行卡充值
    在金融系统中通过银行卡向平台充值需要通过银行系统和金融系统协同完成。
  3. 教育系统中下单选课业务
    在线教育系统中,用户购买课程,下单支付成功后学生选课成功,此事务由订单系统和选课系统协同完成。
  4. SNS系统的消息发送
    在社交系统中发送站内消息同时发送手机短信,一次消息发送由站内消息系统和手机通信系统协同完成。

CAP理论

如何进行分布式事务控制?CAP理论是分布式事务处理的理论基础。了解了CAP理论有助于帮助我们研究分布式事务的处理方案。
CAP理论是:分布式系统在设计时系统只能在一致性(Consistency)、可用性(Availability)、分区容忍性(Partition Tolerance)中满足两种,无法兼顾三种。
一致性(Consistency):服务A、B、C三个节点存储了用户数据,三个节点的数据需要保持同一时刻数据一致性
可用性(Availability):服务A、B、C三个节点,其中一个节点存宕机了不影响整个集群对外服务,如果只有服务A节点,当服务A宕机整个系统将无法提供服务,增加服务B、C是为了保证系统的可用性
分区容忍性(Partition Tolerance):分区容忍性就是允许系统通过网络协同工作,分区容忍性主要解决了由于网络分区导致数据的不完整及无法访问等问题。
分布式系统不可避免的出现了多个系统通过网络协同工作的场景,节点之间难免会出现网络中断,网络延迟等现象,这种现象一旦出现就导致数据被分散在不同的节点上,这就是网络分区。

分布式系统能否兼顾C、A、P

在保证分区容忍性的前提下一致性和可用性无法兼顾,如果要提高系统的可用性就要增加多个节点,如果要保证数据一致性就要实现每个节点的数据一致,节点越多可用性越好,但是数据一致性越差,所以,在进行分布式系统设计时,同时满足“一致性”、“可用性”和“分区容忍性”几乎是不可能的。

CAP的组合方式
  1. CA:放弃分区容忍性,加强一致性和容忍性,关系型数据库是按照CA进行设计的
  2. AP:放弃一致性,加强可用性和人去容忍性,追求最终一致性,很多NoSql数据库是按照AP进行设计的
  3. CP:放弃可用性,加强一致性和分区容忍性,一些强一致性要求的系统是按照CP进行设计,比如跨行转账,一次转账请求要等待双方银行系统都完成整个事务才算完成
    说明:由于网络问题的存在CP系统可能会出现等到超时等,如果没有处理超时问题则整个系统会出现阻塞。
    在分布式系统设计中AP应用较多,即保证分区容忍性和可用性,牺牲数据一致性,保证数据最终一致性,比如:订单退款,今日亏款成功,明日账户到账,只要在预订的用户可以接受的时间内退款事务走完即可。

解决方案

两阶段提交协议(2PC)

两阶段提交由协调者和参与者组成,共经过两个阶段和三个操作,部分关系型数据如Oracle,MySql支持两阶段提交协议。
2PC协议流程图
在这里插入图片描述

  1. 第一阶段:准备阶段(prepare)
    协调者通知参与者准备提交订单,参与者开始投票,参与者完成准备工作向协调者回应yes
  2. 第二阶段:提交(commit)/回滚(rollback)阶段
    协调者根据参与者的投票结果发起最终的提交指令,如果有参与者没有准备好则发起回滚指令。
    一个下单减库存的例子:
    在这里插入图片描述
  3. 应用程序连接两个数据源
  4. 如果应用程序通过事务协调向两个库发起prepare,两个数据库收到消息分别执行本地事务(记录日志),但不提交,如果执行成功则回复yes,否则回复no
  5. 事务协调器收到回复,只要有一方回复no则分别向参与者发起回滚事务,参与者回滚事务
  6. 事务协调器收到回复,全部回复yes,此时向参与者发起提交事务。如果参与者有一方提交事务失败则由事务协调器发起回滚事务。
2PC的优缺点

优点:实现强一致性,部分关系型数据支持(Oracle、MySQL等)
缺点:整个事务的执行需要由协调者在多个节点之间去协调,增加了事务的执行时间,性能低下。
解决方案:springboot+Atomikors or Bitronix

三阶段提交协议(3PC)

三阶段提交3PC:在2PC的第一步分成了2步并且引入了超时机制,解决了2PC的痛点,第一步先向参与者发出一个信号,看看大家是否都能提交,如果可以就返回yes,否则返回no,第二步PreCommit阶段,预提交一下,如果参与者可以完成Commit,就返回ack进行确认,如果不能则放弃提交本次事务,第三部doCommit阶段,进行真正的事务提交。

事务补偿(TCC)

TCC实物补偿机制是基于2PC实现的业务层事务控制方案,它是Try,Confirm和Cancel三个单词的首字母,含义如下:

  1. Try检查及预留业务资源
    完成提交事务前的检查,并预留好资源
  2. Confirm确认执行业务操作
    对Try阶段预留的资源正式执行
  3. Cancel取消执行业务操作
    对Try阶段预留的资源释放
    以下单减库存的业务为例:
    在这里插入图片描述
    1、 Try
    下单业务由订单服务和库存服务协同完成,在try阶段订单服务和库存服务完成检查和预留资源。订单服务检查当前是否满足提交订单的条件(比如:当前存在未完成订单的不允许提交新订单)。库存服务检查当前是否有充足的库存,并锁定资源。
  4. Confirm
    订单服务和库存服务成功完成Try后开始正式执行资源操作。订单服务向订单写一条订单信息。库存服务减去库存。
  5. Cancel
    如果订单服务和库存服务有一方出现失败则全部取消操作。订单服务需要删除新增的订单信息。库存服务将减去的库存再还原。
TCC优缺点

优点:最终保持数据的一致性,在业务层实现事务控制,灵活性好
缺点:开发成本高,每个事务操作每个参与者都需要实现try\confirm\cancel三个接口

消息队列实现最终一致

本案例是将分布式事务拆分成多个本地事务来完成,并且有消息队列已不协调完成,如下图:
在这里插入图片描述

  1. 订单服务和库存服务完成检查和预留资源
  2. 订单服务在本地事务中完成添加订单表记录和添加“减少库存任务消息”。
  3. 由定时任务根据消息表的记录发送给MQ通知库存服务执行减库存操作。
  4. 库存服务执行减少库存,并且记录执行消息状态(为避免重复执行消息,在执行减库存之前查询是否执行过此消息)。
  5. 库存服务向MQ发送完成减少库存的消息。
  6. 订单服务接收到完成库存减少的消息后删除原来添加的“减少库存任务消息”。
    实现最终事务一致要求:预留资源成功理论上要求正式执行成功,如果执行失败会进行重试,要求业务执行方法实现幂等。
消息队列实现数据一致性优缺点

优点:有mq按异步的方式协调完成事务,性能较高
不用实现try/confirm/cancel接口,开发成本比TCC低
缺点:此方式基于关系型数据库本地事务来实现,会频繁读写数据库,浪费数据库资源,另外对于高并发操作不是最佳方案。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

double_lifly

点喜欢就是最好的打赏!!

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值