分布式事务

一、什么是分布式事务?

在分布式系统中一次操作由多个系统协同完成,这种一次事务操作涉及多个系统通过多个网络协同完成的过程称为分布式事务。

二、分布式系统分类

  • 多个系统协调完成一个事务,并且使用多个数据库
    在这里插入图片描述
  • 多个系统协调完成一个事务,即使使用的是同一个数据库
    在这里插入图片描述
  • 一个系统完成一个事务,但是使用到多个数据库
    在这里插入图片描述

三、cap理论

为了解决分布式事务,提出了CAP理论。
在这里插入图片描述

  • C:Consistency 一致性:服务A、B、C三个节点都存储了用户数据,三个节点的数据需要保持同一个时刻数据一致性。
  • A:Availability 可用性:服务A、B、C三个节点,其中一个节点宕机不影响整个集群对完提供服务,如果只有服务A节点,当服务A节点宕机整个系统将无法提供服务,增加服务B、C是为了保证系统的可用性。
  • P:Partition Tolerance 分区容忍性:就是允许系统通过网络协同工作,分区容忍性就是为了要解决由于网络分区导致数据的不完整及无法访问等问题。

注:这三个特性无法同时兼顾
在保证分区容忍性的前提下,一致性和可用性无法兼顾,如果要提高系统的可用性就要增加多个节点,如果要保证数据的一致性就要实现每个节点的数据一致,节点越多可用性越好,但是数据一致性越差。
所以,在进行分布式系统设计时,同时满足“一致性”、“可用性”和“分区容忍性”三者几乎是不可能的。
CAP有哪些组合方式?
1:CA: 放弃分区容忍性,加强一致性和可用性,关系型数据库按照CA进行设计。
2:AP:放弃一致性,加强可用性和分区容忍性,追求最终一致性,很多noSQL按照AP进行设计。
说明:这里放弃一致性是指放弃强一致性,强一致性就是写入成功立即要查询出最新数据,追求最终一致性是指允许暂时的数据不一致,只要最终在用户接受的时间内数据一致即可。
3:CP:放弃可用性,加强一致性和分区容忍性,一些强一致性要求的系统按CP进行设计,比如银行转账,一次转账请求要求等待双方银行系统都完成整个事务才算完成。
说明:由于网络问题的存在CP系统可能会出现等待超时,如果没有处理超时问题则整个系统会出现阻塞。*

总结:在分布式系统设计中AP的应用较多,即保证分区容忍性和可用性,牺牲数据的强一致性(写操作后立刻读取到最 新数据),保证数据最终一致性。比如:订单退款,今日退款成功,明日账户到账,只要在预定的用户可以接受的 时间内退款事务走完即可。

两阶段提交协议(2PC)

为解决分布式系统的数据一致性问题出现了两阶段提交协议(2 Phase Commitment Protocol),两阶段提交由 协调者和参与者组成,共经过两个阶段和三个操作,部分关系数据库如Oracle、MySQL支持两阶段提交协议,本节 讲解关系数据库两阶段提交协议。
参考: 2PC:https://en.wikipedia.org/wiki/Two-phase_commit_protocol

2PC协议流程图:
在这里插入图片描述

1)第一阶段:准备阶段(prepare) 协调者通知参与者准备提交订单,参与者开始投票。 协调者完成准备工作向协调者回应Yes。
2)第二阶段:提交(commit)/回滚(rollback)阶段 协调者根据参与者的投票结果发起最终的提交指令。 如果有参与者没有准备好则发起回滚指令。
一个下单减库存的例子:
在这里插入图片描述
1、应用程序连接两个数据源。 2、应用程序通过事务协调器向两个库发起prepare,两个数据库收到消息分别执行本地事务(记录日志),但不提
交,如果执行成功则回复yes,否则回复no。 3、事务协调器收到回复,只要有一方回复no则分别向参与者发起回滚事务,参与者开始回滚事务。
4、事务协调器收到回复,全部回复yes,此时向参与者发起提交事务。如果参与者有一方提交事务失败则由事务协 调器发起回滚事务。

2PC的优点:实现强一致性,部分关系数据库支持(Oracle、MySQL等)。 缺点:整个事务的执行需要由协调者在多个节点之间去协调,增加了事务的执行时间,性能低下。 解决方案有:springboot+Atomikos or Bitronix

3PC主要是解决协调者与参与者通信阻塞问题而产生的,它比2PC传递的消息还要多,性能不高。详细参考3PC: https://en.wikipedia.org/wiki/Three-phase_commit_protocol

事务补偿(TCC)

TCC事务补偿是基于2PC实现的业务层事务控制方案,它是Try、Confirm和Cancel三个单词的首字母,含义如下:
1、Try 检查及预留业务资源
完成提交事务前的检查,并预留好资源。
2、Confirm 确定执行业务操作
对try阶段预留的资源正式执行。
3、Cancel 取消执行业务操作
对try阶段预留的资源释放。

下边用一个下单减库存的业务为例来说明:
在这里插入图片描述
1、Try 下单业务由订单服务和库存服务协同完成,在try阶段订单服务和库存服务完成检查和预留资源。 订单服务检查当前是否满足提交订单的条件(比如:当前存在未完成订单的不允许提交新订单)。 库存服务检查当前是否有充足的库存,并锁定资源。
2、Confirm
订单服务和库存服务成功完成Try后开始正式执行资源操作。
订单服务向订单写一条订单信息。
库存服务减去库存。
3、Cancel
如果订单服务和库存服务有一方出现失败则全部取消操作。
订单服务需要删除新增的订单信息。
库存服务将减去的库存再还原。

优点:最终保证数据的一致性,在业务层实现事务控制,灵活性好。 缺点:开发成本高,每个事务操作每个参与者都需要实现try/confirm/cancel三个接口。

注意:TCC的try/confirm/cancel接口都要实现幂等性,在为在try、confirm、cancel失败后要不断重试。 什么是幂等性?
幂等性是指同一个操作无论请求多少次,其结果都相同。 幂等操作实现方式有:
1、操作之前在业务方法进行判断如果执行过了就不再执行。
2、缓存所有请求和处理的结果,已经处理的请求则直接返回结果。
3、在数据库表中加一个状态字段(未处理,已处理),数据操作时判断未处理时再处理。

消息队列实现最终一致

本方案是将分布式事务拆分成多个本地事务来完成,并且由消息队列异步协调完成,如下图:
下边以下单减少库存为例来说明:
在这里插入图片描述
1、订单服务和库存服务完成检查和预留资源。
2、订单服务在本地事务中完成添加订单表记录和添加“减少库存任务消息”。
3、由定时任务根据消息表的记录发送给MQ通知库存服务执行减库存操作。
4、库存服务执行减少库存,并且记录执行消息状态(为避免重复执行消息,在执行减库存之前查询是否执行过此 消息)。
5、库存服务向MQ发送完成减少库存的消息。 6、订单服务接收到完成库存减少的消息后删除原来添加的“减少库存任务消息”。
实现最终事务一致要求:预留资源成功理论上要求正式执行成功,如果执行失败会进行重试,要求业务执行方法实
现幂等。

优点 :
由MQ按异步的方式协调完成事务,性能较高。 不用实现try/confirm/cancel接口,开发成本比TCC低。 缺点:
此方式基于关系数据库本地事务来实现,会出现频繁读写数据库记录,浪费数据库资源,另外对于高并发操作不是最佳方案。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值