作者:架构师小白, 来源:公众号-程序员虎哥
前言
什么是分布式事务?介绍这个之前,先了解下这几个问题
- 事务是什么?
- 本地事务是什么?
- 分布式是什么?
- 分布式事务是什么?
事务是什么?
完成某件事情,可能有多个参与者需要执行多个步骤,最终多个步骤要么全部成功,要么全部失败。
举个栗子:支付宝上A给B转账100元,A账户扣100,B账户增加100,这就是一个事务,这个操作中要么都成功,要么都失败。
事务的场景有很多,参与者也是多种多样。比如
-
用户成功注册然后发送邮件,包含2个操作:向数据库插入用户信息,给用户发送邮件,主要的2个参与者:数据库、邮件服务器
-
使用微信充值话费,包含2个操作:微信账户资金减少,手机余额增加,主要的2个参与者:微信账户、手机号服务商账户
事务的参与者是多种多样的,不过本文我们主要以数据库中的事务来做说明。
本地事务是什么?
本地事务,简单理解就是事务中所有操作发生在同一个数据库中的情况。
比如A给B转账,A和B的账户位于同个数据库中。
通常我们用的都是关系型数据库,比如:MySQL、Oracle,这些数据库默认情况,已经实现了事务的功能,即在一个数据库中执行一个事务操作,数据库本身就可以确保这个事务的正确性,而不需要我们自己去考虑:怎样确保事务的正确性。
另外,关注公众号java锦囊,在后台回复:面试,可以获取我整理的 MySQL、分布式系列面试题和答案,非常齐全。
数据库事务的4大特性
- 一致性
事务操作之后的结果和期望的结果是一致的,A给B转账100,事务结束之后,看到A的账户应该减少100,B的账户应该增加100,不会出现其他情况
- 原子性
事务的整个过程如原子操作一样,最终要么全部成功,要么全部失败,这个原子性是从最终结果来看的,整个过程是不能分割的。
- 隔离性
一个事务的执行不能被其他事务干扰。即一个事务内的操作及使用的数据对并发的其他事务是隔离的,并发执行的各个事务之间不能互相干扰。
- 持久性
一个事务一旦提交,它对数据库中数据的改变就应该是永久性的。当事务提交之后,数据会持久化到硬盘,修改是永久性的。
分布式是什么?
完成某件事情有多个参与者,多个参与者分布在不同机器,这些机器之间通过网络或者其他方式进行通讯。
比如使用工行卡给微信充值,工行卡的账户位于工商银行的数据库中,而微信账户位于微信的数据库中,2个数据库位于不同的地方。
分布式事务是什么?
分布式、事务这2个概念讲清楚了,那么分布式事务就很容易理解:事务的多个参与者分布在不同的地方。
单个数据库中我们很容易确保事务正确性,但是当事务的参与者位于多个数据库中的时候,如何确保事务的正确性呢?
比如:A用户给B用户转账,A用户数据位于DB1中,B用户数据位于DB2中
step1.通过网络,给DB1发送指令:给A账户减少100
step2.通过网络,给DB2发送指令:给B账户增加100
step1成功之后,执行step2的时,网络出现故障,导致step2执行失败,最终:A减少了100,B却没有增加100,最终的结果和期望的结果不一致,导致了事务的失败。
在介绍分布式事务的解决方案之前,我们需要先了解另外2个概念:CAP和Base理论,这2个理论为解决分布式事务的提供了依据。
CAP理论
理解CAP概念
CAP是 Consistency、Availability、Partition tolerance三个词语的缩写,分别表示一致性、可用性、分区容忍性,下边我们分别来解释。
为了方便对CAP理论的理解,我们结合电商系统中的一些业务场景来理解CAP。
如下图,是商品信息管理的执行流程:
整体执行流程如下:
1、商品服务请求主数据库写入商品信息(添加商品、修改商品、删除商品)
2、主数据库向商品服务响应写入成功。
3、商品服务请求从数据库读取商品信息。
C - Consistency
一致性是指写操作后的读操作可以读取到最新的数据状态,当数据分布在多个节点上,从任意结点读取到的数据都是最新的状态。
上图中,商品信息的读写要满足一致性就是要实现如下目标:
1、商品服务写入主数据库成功,则向从数据库查询新数据也成功。
2、商品服务写入主数据库失败,则向从数据库查询新数据也失败。
如何实现一致性?
1、写入主数据库后要将数据同步到从数据库。
2、写入主数据库后,在向从数据库同步期间要将从数据库锁定,待同步完成后再释放锁,以免在新数据写入从库的过程中,客户端向从数据库查询到旧的数据。
分布式系统一致性的特点
1、由于存在数据同步的过程,写操作的响应会有一定的延迟。
2、为了保证数据一致性会对资源暂时锁定,待数据同步完成释放锁定资源。
3、如果请求数据同步失败的结点则会返回错误信息,一定不会返回旧数据。
A - Availability
可用性是指任何事务操作都可以得到响应结果,且不会出现响应超时或响应错误。
上图中,商品信息读取满足可用性就是要实现如下目标:
-
从数据库接收到数据查询的请求则立即能够响应数据查询结果。
-
从数据库不允许出现响应超时或响应错误。
如何实现可用性?
-
写入主数据库后要将数据同步到从数据库。
-
由于要保证从数据库的可用性,不可将从数据库中的资源进行锁定。
-
即使数据还没有同步过来,从数据库也要返回要查询的数据,哪怕是旧数据,如果连旧数据也没有则可以按照约定返回一个默认信息,但不能返回错误或响应超时。
分布式系统可用性的特点
- 所有请求都有响应,且不会出现响应超时或响应错误。
P - Partition tolerance
通常分布式系统的各个结点部署在不同的子网,这就是网络分区,不可避免的会出现由于网络问题而导致结点之间通信失败,此时仍可对外提供服务,这叫分区容忍性。
上图中,商品信息读写满足分区容忍性就是要实现如下目标:
-
主数据库向从数据库同步数据失败不影响读写操作。
-
其一个结点挂掉不影响另一个结点对外提供服务。
如何实现分区容忍性?
-
尽量使用异步取代同步操作,例如使用异步方式将数据从主数据库同步到从数据,这样结点之间能有效的实现松耦合。
-
添加从数据库结点,其中一个从结点挂掉其它从结点提供服务。
分布式分区容忍性的特点
- 分区容忍性分是布式系统具备的基本能力
CAP组合方式
上边商品管理的例子是否同时具备 CAP呢?
在所有分布式事务场景中不会同时具备CAP三个特性,因为在具备了P的前提下C和A是不能共存的。
比如,下图满足了P即表示实现分区容忍:
本图分区容忍的含义是:
1)主数据库通过网络向从数据同步数据,可以认为主从数据库部署在不同的分区,通过网络进行交互。
2)当主数据库和从数据库之间的网络出现问题不影响主数据库和从数据库对外提供服务。
3)其一个结点挂掉不影响另一个结点对外提供服务。
如果要实现C则必须保证数据一致性,在数据同步的时候为防止向从数据库查询不一致的数据则需要将从数据库数据锁定,待同步完成后解锁,如果同步失败从数据库要返回错误信息或超时信息。
如果要实现A则必须保证数据可用性,不管任何时候都可以向从数据查询数据,则不会响应超时或返回错误信息。
通过分析发现在满足P的前提下C和A存在矛盾性,如下:
主从库之间网络出现故障的情况下,主库的数据无法同步给从库,为了确保外面看到数据是一致的,此时从库不能让外部访问,只能让主库对外提供服务,从库失去了可用性。
主从库之间网络出现故障的情况下,主库的数据无法同步给从库,此时2个库数据是不一致的,如果此允许2个库都可以对外提供服务(可用性),那么2个库访问的数据是不一致的。
所以CAP无法同时满足,通常情况下,在分布式系统中,多个节点分在不同的网络节点中,网络故障是无法完全避免的,所以P是肯定会存在的,此时我们需要考虑P和另外2个如何组合的问题。
CAP有哪些组合方式呢?
所以在生产中对分布式事务处理时要根据需求来确定满足CAP的哪两个方面。
1)AP:
放弃一致性,追求分区容忍性和可用性。这是很多分布式系统设计时的选择。
例如:
上边的商品管理,完全可以实现AP,前提是只要用户可以接受所查询的到数据在一定时间内不是最新的即可。
通常实现AP都会保证最终一致性,后面讲的BASE理论就是根据AP来扩展的,一些业务场景 比如:订单退款,今日退款成功,明日账户到账,只要用户可以接受在一定时间内到账即可。
2)CP:
放弃可用性,追求一致性和分区容错性,我们的zookeeper其实就是追求的强一致。
3)CA:
放弃分区容忍性,即不进行分区,不考虑由于网络不通或结点挂掉的问题,则可以实现一致性和可用性。
那么系统将不是一个标准的分布式系统,我们最常用的关系型数据就满足了CA。
上边的商品管理,如果要实现CA则架构如下:
主数据库和从数据库中间不再进行数据同步,数据库可以响应每次的查询请求,通过事务隔离级别实现每个查询请求都可以返回最新的数据。
另外,关注公众号java锦囊,在后台回复:面试,可以获取我整理的 MySQL、分布式系列面试题和答案,非常齐全。
总结
通过上面我们已经学习了CAP理论的相关知识,CAP是一个已经被证实的理论:一个分布式系统最多只能同时满足一致性(Consistency)、可用性(Availability)和分区容忍性(Partition tolerance)这三项中的两项。它可以作为我们进行架构设计、技术选型的考量标准。对于多数大型互联网应用的场景,结点众多、部署分散,而且现在的集群规模越来越大,所以节点故障、网络故障是常态,而且要保证服务可用性达到N个9(99.99…%),并要达到良好的响应性能来提高用户体验,因此一般都会做出如下选择:保证P和A,舍弃C强一致,保证最终一致性
Base理论
理解强一致性和最终一致性
CAP理论告诉我们一个分布式系统最多只能同时满足一致性(Consistency)、可用性(Availability)和分区容忍性(Partition tolerance)这三项中的两项,其中AP在实际应用中较多,AP即舍弃一致性,保证可用性和分区容忍性,但是在实际生产中很多场景都要实现一致性,比如前边我们举的例子主数据库向从数据库同步数据,即使不要一致性,但是最终也要将数据同步成功来保证数据一致,这种一致性和CAP中的一致性不同,CAP中的一致性要求在任何时间查询每个结点数据都必须一致,它强调的是强一致性,但是最终一致性是允许可以在一段时间内每个结点的数据不一致,但是经过一段时间每个结点的数据必须一致,它强调的是最终数据的一致性。
Base理论介绍
BASE 是 Basically Available(基本可用)、Soft state(软状态)和 Eventually consistent (最终一致性)三个短语的缩写。BASE理论是对CAP中AP的一个扩展,通过牺牲强一致性来获得可用性,当出现故障允许部分不可用但要保证核心功能可用,允许数据在一段时间内是不一致的,但最终达到一致状态。满足BASE理论的事务,我们称之为“柔性事务”。
基本可用
分布式系统在出现故障时,允许损失部分可用功能,保证核心功能可用。如,电商网站交易付款出现问题了,商品依然可以正常浏览。
软状态
由于不要求强一致性,所以BASE允许系统中存在中间状态(也叫软状态),这个状态不影响系统可用性,如订单的"支付中"、“数据同步中”等状态,待数据最终一致后状态改为“成功”状态。
最终一致
最终一致是指经过一段时间后,所有节点数据都将会达到一致。如订单的"支付中"状态,最终会变为“支付成功”或者"支付失败",使订单状态与实际交易结果达成一致,但需要一定时间的延迟、等待。