三、MySQL事务
3.1 什么是事务? 有哪些特性?
如何保障数据库的某些操作是不可分割的,要么全部执行成功 ,要么全部失败,不允许出现中间状态的数据? —— 「事务(Transaction)」
事务是一组操作单元的集合,能够使数据从一种状态转变为另一种状态。事务是由存储引擎中实现的,MylSAM不支持事务,InnoDB支持。
实现事务必须要遵守** 4 个特性ACID
**:
- 原子性(Atomicity,A):一个事务中的操作要么全都完成,要么全都不完成,不会出现中间状态。若事务在执行的过程中出现错误,会回滚到事务开始前的状态(通过
undo log
实现); - 一致性(Consistency,C):事务操作前后,数据库保持一致性状态,即满足数据库的完整性约束和规则(由持久性+原子性+隔离性,实现保证一致性);
- 隔离性(Isolation,I):数据库允许多个事务并发,多个事务并发同时使用相同的数据时,不会互相干扰,对于其他事务隔离的,这是通过**MVCC(多版本并发控制)**实现的;
- 持久性(Durability,D):事务处理结束后,对数据的修改是永久的,即使系统故障也不会丢失,持久性是通过
redo log
来保证的。
3.2 并发事务会出现什么问题?
MySQL 服务端是允许多个客户端连接的,这意味着 MySQL 会出现同时处理多个事务的情况。在同时处理多个事务的时候,就可能出现脏读(dirty read)、不可重复读(non-repeatable read)、幻读(phantom read)的问题。这是事务的**隔离性**的相关问题,也是为什么要引入隔离性的主要原因。
3.2.1 什么是脏读?
如果一个事务「读到」另一个未提交事务所修改过的数据,就意味着发生了「脏读」现象。
因为这个未提交的事务有可能执行失败而发生回滚,那么这个事务读取到的数据就是过期的数据,于是产生了**「脏读」**
3.2.2 什么是不可重复读?
在一个事务内多次读取同一个数据,如果出现前后两次读到的数据不一样的情况,就意味着发生了「不可重复读」现象。
出现这种情况的主要原因是,事务B在事务A两次读取之间提交了,从而修改了数据库。
3.2.3 什么是幻读?
在一个事务内多次查询某个符合查询条件的「记录数量」,如果出现前后两次查询到的记录数量不一样的情况,就意味着发生了「幻读」现象。
幻读与不可重复的区别在于满足查询条件的记录数量发生了变化,而不是记录本身发生变化。
3.2.4 总结
当多个事务并发执行时可能会遇到「脏读、不可重复读、幻读」的现象,这些现象会对事务的一致性产生不同程序的影响。
- 脏读:读到其他事务未提交的数据;
- 不可重复读:前后读取的数据不一致;
- 幻读:前后读取的记录数量不一致。
这三个现象的严重性排序如下:
MySQL通过**隔离性来规避这三种现象,SQL标准提出了四种隔离级别**,隔离级别越高,越能够避免上述现象的发生,事务的一致性更强,但同时也会带来并发性能的损失。
3.3 事务的隔离级别有哪些? 怎么实现的?
3.3.1 事务的四种隔离级别
MySQL中存在四种隔离级别,隔离级别越高,并发性能效率越低,但能够减少不一致性:
- 读未提交:一个事务还没有提交时,对数据的修改可以被其他事务看到。会存在脏读、不可重复读、幻读现象;
- 读已提交:只有事务被提交后,其他事务才可以看到它做的修改。存在不可重复读、幻读现象;
- 可重复读:一个事务在其执行过程中多次执行相同的查询,始终看到相同的数据。存在幻读现象;(InnoDB的默认隔离级别)
- 串行化:最高隔离级别,若事务访问相同的记录,则通过加锁实现同一时刻只有一个事务执行。
按隔离水平高低排序如下:
针对不同的隔离级别,并发事务时可能发生的现象也会不同。
3.3.2 隔离级别是如何实现的?
- 读未提交:无需处理,直接读取最新的就行了;
- 读已提交:MVCC机制 + 读写锁(只对查询的记录加锁,且读取完后立即释放),每次读取数据时会生成一个新的Read View,在这个Read View中,只能看到在生成前已提交的事务修改的数据;
- 可重复读:MVCC机制 + 读写锁 + 间隙锁(锁会持续到事务结束),在启动事务时生成一个Read View,然后整个事务期间都是用这个Read View;
- 串行化:通过加读写锁的方式实现互斥。
3.3.3 什么是MVCC?
MVCC(多版本并发控制,Multiversion Concurrency Control)是一种用于管理数据库并发访问的方法。通过**保存数据的多个版本**来实现不同事务对数据的并发访问,从而避免了加锁导致的性能瓶颈,并减少了事务冲突。
一些关键概念:
- 版本链:每条记录会存储多个版本,每个版本对应一次数据的修改操作。这些版本通常通过链表的方式链接在一起。
- 事务ID:每个事务在启动时会获取一个唯一的事务ID。这个ID用于标识事务的先后顺序,并帮助MVCC判断哪些版本对当前事务可见。
- 快照(Snapshot):在某个事务读取数据时,数据库会生成一个快照,即当前可见的数据版本集合。这个快照包括了所有在事务开始之前已经提交的修改,但不包括事务开始之后的未提交修改。
- Read View:在可重复读(Repeatable Read)和读已提交(Read Committed)等隔离级别下,MVCC会为每个事务创建一个Read View。Read View决定了当前事务在访问数据时可以看到哪些版本。对于可重复读隔离级别,一个事务的Read View会在事务开始时生成,并在整个事务期间保持不变;对于读已提交隔离级别,每次读取数据时都会生成新的Read View。
3.3.4 Read View在MVCC中是如何工作的?
Read View 有四个重要的字段:
- m_ids :指的是在创建 Read View 时,当前数据库中「活跃事务」的事务 id 列表,注意是一个列表,“活跃事务”指的就是,启动了但还没提交的事务。
- min_trx_id :指的是在创建 Read View 时,当前数据库中「活跃事务」中事务 id 最小的事务,也就是 m_ids 的最小值。
- max_trx_id :这个并不是 m_ids 的最大值,而是创建 Read View 时当前数据库中应该给下一个事务的 id 值,也就是全局事务中最大的事务 id 值 + 1;
- creator_trx_id :指的是创建该 Read View 的事务的事务 id。
同时,对于聚簇索引中的记录行,其行结构中有隐藏列,其中存在:
trx_id
,当一个事务对某条聚簇索引记录进行改动时,就会把该事务的事务 id 记录在 trx_id 隐藏列里;roll_pointer
,每次对某条聚簇索引记录进行改动时,都会把旧版本的记录写入到 undo 日志中,然后这个隐藏列是个指针,指向每一个旧版本记录,于是就可以通过它找到修改前的记录。
于是,通过**对比事务的Read View中和要查询的记录的trx_id
就可以知道哪些记录是当前事务可见的**。
trx_id < min_trx_id
:说明这条记录是创建这个Read View之前的事务提交的,可见。trx_id >= max_trx_id
:说明这条记录是这个Read View创建之后的事务生成的,不可见。min_trx_id <= trx_id < max_trx_id
:trx_id
在m_ids
中:说明还未提交,不可见;trd_id
不在m_ids
中,说明已经提交,可见。
如果当前事务需要访问的记录在事务的Read View中不可见,数据库会**尝试读取该记录的前一个可见版本**。这是因为每条记录都有一个版本链,保存了历史版本。数据库通过遍历版本链,找到事务可以看到的最新版本来返回给用户。
这种通过「版本链」来控制并发事务访问同一个记录时的行为就叫 MVCC(多版本并发控制)。
3.4 可重复读是怎么尽量解决幻读的?
可重复读无法彻底解决幻读问题,但是串行化的隔离级别会导致并发性能很差。因此InnoDB使用「可重复读」作为默认隔离级别,因为**「可重复读」可以很大程度上避免幻读现象**。
3.4.1 快照读和当前读
MySQL 里除了**普通查询(select)是快照读,其他都是当前读,比如 update、insert、delete,这些语句执行前都会查询最新版本的数据**,再做进一步的操作。
针对快照读,由于「可重复读」会在事务启动是就创建了Read View,后续的查询语句都是通过这个Read View来查询可见的数据。因此,「可重复读」隔离级别下的快照读不会产生幻读现象,MVCC方式可以解决幻读问题。
3.4.2 当前读如何避免幻读?
对于当前读,因为每次执行的时候需要读取最新的数据,包括其他事务新提交的数据。所以可能会出现两次查询结果满足条件的记录数量不一致问题(幻读)。
为什么不会出现不可重复读现象?
因为可重复读隔离级别会在事务执行期间加记录锁,避免了记录被修改,可以完全解决不可重复读现象。但是无法完全解决幻读现象。
因此InnoDB引擎引出了**间隙锁**来解决这个问题。事务执行期间,除了对记录本身加锁外,还会对前面的间隙加锁,防止新的记录插入。例如:表中有一个范围 id 为(3,5)间隙锁,那么其他事务就无法插入 id = 4 这条记录了,这样就有效的防止幻读现象的发生。
总体来说,可重复读通过next-key锁(记录锁 + 间隙锁)来保证不会出现不可重复读现象,并尽量防止幻读现象的出现。
3.4.3 幻读被完全解决了吗?
可重复读隔离级别下虽然很大程度上避免了幻读,但是还是没有能完全解决幻读。
下面这个场景也会发生幻读现象。
- T1 时刻:事务 A 先执行「快照读语句」:select * from t_test where id > 100 得到了 3 条记录。
- T2 时刻:事务 B 往插入一个 id= 200 的记录并提交;
- T3 时刻:事务 A 再执行「当前读语句」 select * from t_test where id > 100 for update 就会得到 4 条记录,此时也发生了幻读现象。
原因是T1时刻是快照读,不会加锁,直接通过MVCC实现的读取。而T3时刻是当前读,读取了最新的数据。
资料参考
内容大多参考自:[图解MySQL介绍 | 小林coding (xiaolincoding.com)](