分布式事务基础理论

  对于系统而言,鱼与熊掌不可兼得,就让缺憾成为另一种美

                  ——微微一笑

内容提要

  1. 事务的概念

  2. 本地事务的理解

  3. 事务特性

  4. 分布式事务

  5. 分布式事务产生的场景

  6. 基础理论CAP

  7. BASE理论

基础认识

一、什么是事务?

  举个生活中的例子:你去小卖铺买东西,“一手交钱,一手交货”就是一个事务的例子,交钱和交货必须全部成功,事务才算成功,任一个活动失败,事务将撤销所有已成功的活动。

事务的定义: 事务可以看做是一次大的活动,它由不同的小活动组成,这些活动要么全部成功,要么全部失败。

二、本地事务

在计算机系统中,更多的是通过关系型数据库来控制事务,主要利用数据库本身的事务特性来实现的,因此叫数据库事务,而数据库通常和应用在同一个服务器,也被称为本地事务。

以简单的转账为例:张三向李四转100元

回顾一下数据库事务的四大特性 ACID:

A(Atomic):原子性,构成事务的所有操作,要么都执行完成,要么全部不执行,不可能出现部分成功部分失败的情况。

C(Consistency):一致性,在事务执行前后,数据库的一致性约束没有被破坏。比如:张三向李四转100元,转账前和转账后的数据是正确状态这叫一致性,如果出现张三转出100元,李四账户没有增加100元这就出现了数 据错误,就没有达到一致性。

I(Isolation):隔离性,数据库中的事务一般都是并发的,隔离性是指并发的两个事务的执行互不干扰,一个事务不能看到其他事务运行过程的中间状态。通过配置事务隔离级别可以避脏读、重复读等问题。

D(Durability):持久性,事务完成之后,该事务对数据的更改会被持久化到数据库,且不会被回滚。

数据库事务在实现时会将一次事务涉及的所有操作全部纳入到一个不可分割的执行单元,该执行单元中的所有操作要么都成功,要么都失败,只要其中任一操作执行失败,都将导致整个事务的回滚

如上述例子,这里提供伪代码进行说明:

begin transaction;
//1.本地数据库操作:张三减少金额
//2.本地数据库操作:李四增加金额
commit transation;

分布式事务

  随着互联网的快速发展,软件系统由原来的单体应用转变为分布式应用(大致如下图):分布式系统会把一个应用系统拆分为可独立部署的多个服务,因此需要服务与服务之间远程协作才能完成事务操作,这种分布式系统环境下由不同的服务之间通过网络远程协作完成事务称之为分布式事务,

  • 常见的使用场景
    • 用户注册送积分

    • 创建订单减库存

    • 银行转账

在分布式环境下,相应的事务会变成这样(注意是远程调用

begin transaction;
//1.本地数据库操作:张三减少金额
//2.远程调用:让李四增加金额
commit transation;

想:如果在同一个业务系统中,有没有必要用分布式事务?) 可以设想,当远程调用让李四增加金额成功了,由于网络问题远程调用并没有返回,此时本地事务提交失败就回滚 了张三减少金额的操作,此时张三和李四的数据就不一致了。 因此在分布式架构的基础上,传统数据库事务就无法使用了,张三和李四的账户不在一个数据库中甚至不在一个应用系统里,实现转账事务需要通过远程调用,由于网络问题就会导致分布式事务问题。

分布式事务产生的场景

1、跨JVM进程产生分布式事务

  典型的场景就是微服务架构微服务之间通过远程调用完成事务操作。 比如:订单微服务和库存微服务,下单的同时订单微服务请求库存微服务减库存。

2、跨数据库实例产生分布式事务

  当单体系统需要访问多个数据库(实例)时就会产生分布式事务。 比如:用户信息和积分信息分别在两个MySQL实例存储,用户管理系统删除用户信息,需要分别删除用户信息及用户的积分信息,由于数据分布在不同的数据实例,需要通过不同的数据库链接去操作数据,此时产生分布式事务。

3、多服务访问同一个数据库实例

  比如:订单微服务和库存微服务即使访问同一个数据库也会产生分布式事务,原因就是跨JVM进程,两个微服务持有了不同的数据库链接进行数据库操作,此时产生分布式事务。

分布式系统基础理论CAP

CAP是 Consistency、Availability、Partition tolerance三个词语的缩写,分别表示一致性、可用性、分区容忍性

为了方便对CAP理论的理解,我们结合电商系统中的一些业务场景来理解CAP。 如下图,是商品信息管理的执行流程:

整体执行流程如下:

  1. 商品服务请求主数据库写入商品信息(添加商品、修改商品、删除商品);

  2. 主数据库向商品服务响应写入成功;

  3. 商品服务请求从数据库读取商品信息

C - Consistency: 一致性是指写操作后的读操作可以读取到最新的数据状态,当数据分布在多个节点上,从任意结点读取到的数据都是最新的状态。

上图中,商品信息的读写如何实现一致性?

  • 写入主数据库后要将数据同步到从数据库

  • 写入主数据库后,在向从数据库同步期间要将从数据库锁定,待同步完成后再释放锁,以免在新数据写入成功后,向从数据库查询到旧的数据。

分布式系统一致性的特点

  1. 由于存在数据同步的过程,写操作的响应会有一定的延迟

  2. 为了保证数据一致性会对资源暂时锁定,待数据同步完成释放锁定资源

  3. 如果请求数据同步失败的结点则会返回错误信息,一定不会返回旧数据

A - Availability : 可用性是指任何事务操作都可以得到响应结果,且不会出现响应超时或响应错误。

上图中,商品信息读取如何实现可用性?

  • 写入主数据库后要将数据同步到从数据库

  • 由于要保证从数据库的可用性,不可将从数据库中的资源进行锁定。

  • 即使没有同步过来,从数据库也要返回要查询的数据,哪怕是旧数据,如果连旧数据也没有则可以按照 约定返回一个默认信息,但不能返回错误或响应超时(用户体验)

分布式系统可用性的特点:

  1. 所有请求都有响应,且不会出现响应超时或响应错误

P - Partition tolerance : 通常分布式系统的各各结点部署在不同的子网,这就是网络分区,不可避免的会出现由于网络问题而导致结点之间通信失败,此时仍可对外提供服务,这叫分区容忍性。

上图中,商品信息读写满足分区容忍性就是要实现如下目标: 1、主数据库向从数据库同步数据失败不影响读写操作。 2、其一个结点挂掉不影响另一个结点对外提供服务。

如何实现分区容忍性?

  • 尽量使用异步取代同步操作,例如使用异步方式将数据从主数据库同步到从数据,松耦合。

  • 添加从数据库结点,其中一个从结点挂掉其它从结点提供服务。

分布式分区容忍性的特点:

1、分区容忍性分是布式系统具备的基本能力。

CAP组合方式

  所有分布式事务场景中不会同时具备CAP三个特性,因为在具备了P的前提下C和A是不能共存的。可以看到:鱼与熊掌不可兼得,但是缺憾是一种美

图片来源于网络

CAP有哪些组合方式呢?

  在生产中对分布式事务处理时要根据需求来确定满足CAP的哪两个方面。

1)AP:放弃强一致性,追求分区容忍性和可用性。这是很多分布式系统设计时的选择。例如:上边的商品管理,完全可以实现AP,通常实现AP都会保证最终一致性,一些业务场景比如:订单退款,今日退款成功,明日账户到账,只要用户可以接受在一定时间内到账即可。此外,像Redis分布式锁setNX即AP模型

2)CP: 放弃可用性,追求一致性和分区容错性,我们的zookeeper其实就是追求的强一致,又比如跨行转账,一次转账请 求要等待双方银行系统都完成整个事务才算完成。

3)CA: 放弃分区容忍性,即不进行分区,不考虑由于网络不通或结点挂掉的问题,则可以实现一致性和可用性。那么系统将不是一个标准的分布式系统,我们最常用的关系型数据就满足了CA。也就侧成了单体架构。

BASE理论

BASE 是 Basically Available(基本可用)、Soft state(软状态)和 Eventually consistent (最终一致性)三个短语的缩 写。BASE理论是对CAP中AP的一个扩展,通过牺牲强一致性来获得可用性,当出现故障允许部分不可用但要保证核心功能可用,允许数据在一段时间内是不一致的,但最终达到一致状态。BASE理论的事务,我们称之为“柔性事务”。

基本可用:分布式系统在出现故障时,允许损失部分可用功能,保证核心功能可用。如,电商网站交易付款出现问题了,商品依然可以正常浏览。

软状态:由于不要求强一致性,所以BASE允许系统中存在中间状态(也叫软状态),这个状态不影响系统可用性,如订单的"支付中"、“数据同步中”等状态,待数据最终一致后状态改为“成功”状态。

最终一致:最终一致是指经过一段时间后,所有节点数据都将会达到一致。如订单的"支付中"状态,最终会变 为“支付成功”或者"支付失败",使订单状态与实际交易结果达成一致,但需要一定时间的延迟、等待。

总结

  我们进行架构设计、技术选型的考量标准。对于多数大型互联网应用的场景,结点众多、部署分散,而且现在的集群规模越来越大,所以节点故障、网络故障是常态,而且要保证服务可用性达到N个9(99.99..%),并要达到良好的响应性能来提高用户体验,因此一般都会做出如下选择:保证P和A,舍弃C强一致,保证最终一致性。

结尾

  本文主要是结合基本案例加深对分布式事务的基本理论的理解。如果有帮助,点赞转发加关注,一起努力不迷路

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值