第13章 事务的基础知识
1. 数据库事务概述
事务是数据库区别于文件系统的重要特性之一,当我们有了事务就会让数据库保持一致性
。
InnoDB支持事务,而MyISAM引擎不支持。
1.1 基本概念
事务:事务是一组逻辑操作单元,将数据从一种状态变为另一种状态。
事务处理的原则:保证所有的事务都作为一个工作单元
来执行。在一个事务中执行多个操作
时,要么所有的事务都被提交
,那么这些修改就永久地保存下来;要么就放弃所有的修改
,使得事务回滚到最初的状态。
1.2(重点) 事务的ACID特性
- 原子性(atomicity)
- 原子性是指事务是一个
不可分割的工作单位
,要么全部提交
,要么全部不提交
(失败回滚),没有中间状态。
- 原子性是指事务是一个
- 一致性(consistency)
- 一致性是指事务执行前后,数据从一个
合法的状态
变换到另一个合法的状态
。 - 什么是合法的数据状态?满足
预定的约束
的状态就是合法的状态。这种状态是语义上的,即满足现实的约束
。 - 现实中的约束指的是什么?以转账场景为例,A转账的前后余额必须>=0,A转给B之后A+B的总余额保持不变;数据库字段中
姓名
字段设置为唯一性约束
,事务进行提交或回滚的时候,如果表中的姓名不唯一
,就破坏了事务的一致性的要求。
- 一致性是指事务执行前后,数据从一个
- 隔离性(isolation)
- 事务的隔离性是指一个事务的执行,
不能被其他事务干扰
,即一个事务内部的操作及使用的数据
对并发的其他事务
是隔离的
,并发执行的各个事务之间不能互相干扰。 - 如果无法保证隔离性会怎么样?假设A账户有200元,B账户0元。A账户往B账户转账两次,每次金额为50 元,分别在两个事务中执行。如果无法保证隔离性,会出现下面的情形:
- 事务的隔离性是指一个事务的执行,
UPDATE accounts SET money = money - 50 WHERE NAME = 'AA';
UPDATE accounts SET money = money + 50 WHERE NAME = 'BB';
# B的初始值是0,由于未能保证两个事务的隔离性,转账两次后B的金额为50。
- 持久性(durability)
- 持久性是指一个事务一旦被提交,它对数据库中数据的改变就是永久的。接下来其他操作和数据库故障都不应该对其有任何影响。
- 持久性是通过
事务日志
保证的。日志包括了重做日志
和回滚日志
。当我们通过事务对数据进行修改
的时候,首先会将数据库的变化信息记录到重做日志
中,然后再对数据库中对应的行进行修改。这样做的好处是,即使数据库系统崩溃,数据库重启后也能找到没有更新到数据库系统中的重做日志,重新执行,从而使事务具有持久性。 -
总结
ACID
是事务的四大特征,在这四个特性中,原子性是基础,隔离性是手段,一致性是约束条件,而持久性是目的。
数据库事务,其实就是数据库设计者为了方便起见,把需要保证原子性、隔离性、一致性和持久性的一个或多个数据库操作称为一个事务。
1.3 事务的状态
事务
是一个抽象概念,对应着一个或多个数据库操作,MySQL以执行的不同阶段把事务大致分为以下几个状态。
- 活动的(active)——正在执行
事务对应的数据库操作正在执行过程中时,我们就说该事务处在活动的
状态。 - 部分提交的(partially committed)——在内存中执行,刷新数据到磁盘之前。
当事务中的最后一个操作执行完成,但由于操作都在内存中执行,所造成的影响并没有刷新到磁盘
时,我们就说该事务处在部分提交的
状态。 - 失败的(failed)——遇到错误无法继续执行
当事务处在活动的
或者部分提交的
状态时,可能遇到了某些错误(数据库自身的错误、操作系统错误或者直接断电等)而无法继续执行,又或者人为的停止当前事务的执行,我们就说该事务处在失败的
状态。 - 中止的(aborted)——回滚撤销并终止
如果事务执行了一部分而变为失败的
状态,那么就需要把已经修改的事务中的操作还原到事务执行前的状态。换句话说,就是要撤销失败事务对当前数据库造成的影响。我们把这个撤销的过程称之为回滚
。当回滚
操作执行完毕时,也就是数据库恢复到了执行事务之前的状态,我们就说该事务处在了中止的
状态。 - 提交的(committed)
当一个处在部分提交的
状态的事务将修改过的数据都同步到磁盘
上之后,我们就可以说该事务处在了提交的
状态。
状态转换图:
事务的完成过程:
- 开启事务
- 执行一系列DML操作
- 事务最终结束的状态:要么提交(COMMIT)的状态、要么终止(rollback)的状态
2.事务的基本操作(略)
3.事务的隔离级别(重点)
MySQL是B/S架构
的,对于同一个服务器来说,可以有若干个客户端与之连接,每 个客户端与服务器连接上之后,就可以称为一个会话( Session
)。客户端发起会话向服务器发送的请求语句,这个请求可能是某个事务的一部分,而对于服务器同时处理多个事务。事务有 隔离性
的特性,理论上在某个事务 对某个数据进行访问
时,其他事务应该进行排队
,但我们想在保证事务的隔离性的情况下,又让服务器在处理同一数据时的性能尽可能高,就看如何权衡两者的利弊。
3.1 数据准备
假设有student这个表,并插入了一条数据
CREATE TABLE student (
studentno INT,
name VARCHAR(20),
class varchar(20),
PRIMARY KEY (studentno)
) Engine=InnoDB CHARSET=utf8;
INSERT INTO student VALUES(1, '小谷', '1班');
表中的数据状态如下:
+-----------+--------+-------+
| studentno | name | class |
+-----------+--------+-------+
| 1 | 小谷 | 1班 |
+-----------+--------+-------+
1 row in set (0.00 sec)
3.2 数据并发问题
访问相同数据的事务在不保证串行化的时候会出现哪些问题?
1. 脏写(Dirty Write)
事务A 修改
了 另一个 未提交
事务B 修改过的数据,未提交意味着可能会回滚,这时就发生了脏写。
如果事务B进行了回滚,事务A中的更新就失效了,但事务A最终提交了(脏)数据,这种情况称之为脏写
。
脏写在任何隔离级别下是不可忍受的。
2.脏读(Dirty Read)
事务A读取
了事务B更新但未提交的数据
,如果之后事务B回滚,事务A读取的内容就是临时且失效的。
事务A查询了未提交事务B修改的studentno=1的数据,而事务B稍后进行了回滚,那么事务A读到的是一个不存在的数据,这种现象就成为脏读
。
3. 不可重复读( Non-Repeatable Read )
事务A读取
了一个字段,稍后事务B更新了这个字段;之后事务A再次读取
同一个字段,值就不同
了。这种现象叫做不可重复读
。
事务B中提交了几个 隐式事务
(注意是隐式事务,意味着语句结束事务就提交了),这些事务都修改了studentno=1的记录的列name的值,并且都会提交
。每次事务提交之后,如果Session A中的事务都可以查看到最新的值(不同的数据),这种现象也被称之为 不可重复读
。
4. 幻读( Phantom )
事务A在表中读取了一个字段,事务B在该表中插入
了一些新的行。之后,如果事务A再次读取同一个表,就会多出几行。这种现象称之为幻读。(注意幻读只指的是插入的情况)
事务B中提交了一个 隐式事务
,事务A两次查询的结果不相同,且之后的结果包含事务B插入的新纪录。新插入的那些记录称之为 幻影记录
。
3.3 (重点)SQL标准中的四种隔离级别
并发事务执行过程中遇到的问题对严重性进行排序
脏写 > 脏读 > 不可重复读 > 幻读
设立一些隔离级别,隔离级别越低,并发问题发生的就越多。 SQL标准
中设立了4个 隔离级别
:
READ UNCOMMITTED
:读未提交,在该隔离级别,所有事务都可以看到其他未提交事务的执行结果。不能避免脏读、不可重复读、幻读。READ COMMITTED
:读已提交,一个事务只能看见已经提交事务所做的改变。这是大多数数据库系统的默认隔离级别(但不是MySQL默认的)。可以避免脏读,但不可重复读、幻读问题仍然存在。REPEATABLE READ
:可重复读,事务A在读到一条数据之后,此时事务B对该数据进行了修改并提交
,那么事务A再读该数据,读到的还是原来的内容。可以避免脏读、不可重复读,但幻读问题仍然存在。这是MySQL的默认隔离级别。SERIALIZABLE
:可串行化,确保事务可以从一个表中读取相同的行。在这个事务持续期间,禁止其他事务对该表执行插入、更新和删除操作。所有的并发问题都可以避免,但性能十分低下。能避免脏读、不可重复读和幻读。
脏写
怎么没涉及到?因为脏写这个问题太严重了,不论是哪种隔离级别,都不允许脏写的情况发生。
3.4 (重点) MySQL支持的四种隔离级别
MySQL支持四种隔离级别,但MySQL在REPEATABLE READ的隔离级别下,是可以禁止幻读的问题产生的。(MySQL是如何禁止幻读的?
)
3.5 不同隔离级别的距离
演示1:读未提交之脏读:读到了临时且无效的数据
设置隔离级别为读未提交:
脏读就是指当前事务就在访问数据,并且对数据进行了修改,而这种修改还没有提交到数据库中,这时,另外一个事务也访问并使用了这条数据。
演示2:读已提交
只读已提交的数据(提交到磁盘上的数据),不读临时的数据。
演示3:不可重复读
一个事务并未结束,但另一个事务提交并写入磁盘,两次查询(在提交之前和之后)的结果就会不一样了。
当我们将当前会话的隔离级别设置为可重复读
的时候,当前会话可以重复读,只要这个事务未结束(未提交),无论其他事务如何修改数据,每次读取的结果集都相同。
演示4:幻读
那么如何在REPEATABLE READ
的隔离级别下防止幻读?
答:对select操作手动加行X锁(独占锁)
即使当前记录不存在,当前事务也会获得一把记录锁(InnoDB行锁锁定的是索引,与记录的实体存在与否无关,存在就加行X锁
,不存在就加间隙锁
,其他事务无法插入此索引的记录就杜绝了幻读。
在SEARIALIBLE隔离级别下
,事务A的select操作是会隐式地添加行(X)锁和间隙(X)锁的,那么事务B的插入操作将会被阻塞,事务A可以插入id=3的数据,等待事务A提交之后,事务B才能继续执行(因逐渐冲突执行失败),因此对事务A来说业务是正确的,阻塞了事务B扰乱业务的操作,对事务A的前期读取结果是可以支撑后续业务的。
MySQL的幻读并非两次读取的返回结果集不同,而是事务在插入事先检测并不存在的记录时,却发现这些记录已经存在,之前检测读取的数据如同幻影一般。