MySQL学习[3] ——MySQL事务

三、MySQL事务

3.1 什么是事务? 有哪些特性?

如何保障数据库的某些操作是不可分割的,要么全部执行成功 ,要么全部失败,不允许出现中间状态的数据? —— 「事务(Transaction)

事务是一组操作单元的集合,能够使数据从一种状态转变为另一种状态。事务是由存储引擎中实现的,MylSAM不支持事务,InnoDB支持。

实现事务必须要遵守** 4 个特性ACID**:

  • 原子性(Atomicity,A):一个事务中的操作要么全都完成,要么全都不完成,不会出现中间状态。若事务在执行的过程中出现错误,会回滚到事务开始前的状态通过undo log实现);
  • 一致性(Consistency,C):事务操作前后,数据库保持一致性状态,即满足数据库的完整性约束和规则(由持久性+原子性+隔离性,实现保证一致性);
  • 隔离性(Isolation,I):数据库允许多个事务并发,多个事务并发同时使用相同的数据时,不会互相干扰,对于其他事务隔离的,这是通过**MVCC(多版本并发控制)**实现的;
  • 持久性(Durability,D):事务处理结束后,对数据的修改是永久的,即使系统故障也不会丢失,持久性是通过redo log来保证的。

3.2 并发事务会出现什么问题?

MySQL 服务端是允许多个客户端连接的,这意味着 MySQL 会出现同时处理多个事务的情况在同时处理多个事务的时候,就可能出现脏读(dirty read)、不可重复读(non-repeatable read)、幻读(phantom read)的问题。这是事务的**隔离性**的相关问题,也是为什么要引入隔离性的主要原因。

3.2.1 什么是脏读?

如果一个事务「读到」另一个未提交事务所修改过的数据,就意味着发生了「脏读」现象。

因为这个未提交的事务有可能执行失败而发生回滚,那么这个事务读取到的数据就是过期的数据,于是产生了**「脏读」**

3.2.2 什么是不可重复读?

在一个事务内多次读取同一个数据,如果出现前后两次读到的数据不一样的情况,就意味着发生了「不可重复读」现象。

出现这种情况的主要原因是,事务B在事务A两次读取之间提交了,从而修改了数据库

3.2.3 什么是幻读?

在一个事务内多次查询某个符合查询条件的「记录数量」,如果出现前后两次查询到的记录数量不一样的情况,就意味着发生了「幻读」现象。

幻读与不可重复的区别在于满足查询条件的记录数量发生了变化,而不是记录本身发生变化。

3.2.4 总结

当多个事务并发执行时可能会遇到「脏读、不可重复读、幻读」的现象,这些现象会对事务的一致性产生不同程序的影响

  • 脏读:读到其他事务未提交的数据;
  • 不可重复读:前后读取的数据不一致;
  • 幻读:前后读取的记录数量不一致。

这三个现象的严重性排序如下:

MySQL通过**隔离性来规避这三种现象,SQL标准提出了四种隔离级别**,隔离级别越高,越能够避免上述现象的发生,事务的一致性更强,但同时也会带来并发性能的损失。

3.3 事务的隔离级别有哪些? 怎么实现的?

3.3.1 事务的四种隔离级别

MySQL中存在四种隔离级别,隔离级别越高,并发性能效率越低,但能够减少不一致性:

  • 读未提交:一个事务还没有提交时,对数据的修改可以被其他事务看到。会存在脏读、不可重复读、幻读现象;
  • 读已提交:只有事务被提交后,其他事务才可以看到它做的修改。存在不可重复读、幻读现象;
  • 可重复读:一个事务在其执行过程中多次执行相同的查询,始终看到相同的数据。存在幻读现象;(InnoDB的默认隔离级别)
  • 串行化:最高隔离级别,若事务访问相同的记录,则通过加锁实现同一时刻只有一个事务执行。

按隔离水平高低排序如下:

针对不同的隔离级别,并发事务时可能发生的现象也会不同。

3.3.2 隔离级别是如何实现的?
  • 读未提交:无需处理,直接读取最新的就行了;
  • 读已提交:MVCC机制 + 读写锁(只对查询的记录加锁,且读取完后立即释放),每次读取数据时会生成一个新的Read View,在这个Read View中,只能看到在生成前已提交的事务修改的数据;
  • 可重复读:MVCC机制 + 读写锁 + 间隙锁(锁会持续到事务结束),在启动事务时生成一个Read View,然后整个事务期间都是用这个Read View;
  • 串行化:通过加读写锁的方式实现互斥。
3.3.3 什么是MVCC?

MVCC(多版本并发控制,Multiversion Concurrency Control)是一种用于管理数据库并发访问的方法。通过**保存数据的多个版本**来实现不同事务对数据的并发访问,从而避免了加锁导致的性能瓶颈,并减少了事务冲突。

一些关键概念:

  • 版本链:每条记录会存储多个版本,每个版本对应一次数据的修改操作。这些版本通常通过链表的方式链接在一起。
  • 事务ID:每个事务在启动时会获取一个唯一的事务ID。这个ID用于标识事务的先后顺序,并帮助MVCC判断哪些版本对当前事务可见。
  • 快照(Snapshot):在某个事务读取数据时,数据库会生成一个快照,即当前可见的数据版本集合。这个快照包括了所有在事务开始之前已经提交的修改,但不包括事务开始之后的未提交修改。
  • Read View:在可重复读(Repeatable Read)和读已提交(Read Committed)等隔离级别下,MVCC会为每个事务创建一个Read View。Read View决定了当前事务在访问数据时可以看到哪些版本。对于可重复读隔离级别,一个事务的Read View会在事务开始时生成,并在整个事务期间保持不变;对于读已提交隔离级别,每次读取数据时都会生成新的Read View。
3.3.4 Read View在MVCC中是如何工作的?

Read View 有四个重要的字段:

  • m_ids :指的是在创建 Read View 时,当前数据库中「活跃事务」的事务 id 列表,注意是一个列表,“活跃事务”指的就是,启动了但还没提交的事务
  • min_trx_id :指的是在创建 Read View 时,当前数据库中「活跃事务」中事务 id 最小的事务,也就是 m_ids 的最小值。
  • max_trx_id :这个并不是 m_ids 的最大值,而是创建 Read View 时当前数据库中应该给下一个事务的 id 值,也就是全局事务中最大的事务 id 值 + 1;
  • creator_trx_id :指的是创建该 Read View 的事务的事务 id

同时,对于聚簇索引中的记录行,其行结构中有隐藏列,其中存在:

  • trx_id,当一个事务对某条聚簇索引记录进行改动时,就会把该事务的事务 id 记录在 trx_id 隐藏列里
  • roll_pointer,每次对某条聚簇索引记录进行改动时,都会把旧版本的记录写入到 undo 日志中,然后这个隐藏列是个指针,指向每一个旧版本记录,于是就可以通过它找到修改前的记录。
图片

于是,通过**对比事务的Read View中和要查询的记录的trx_id就可以知道哪些记录是当前事务可见的**。

  • trx_id < min_trx_id:说明这条记录是创建这个Read View之前的事务提交的,可见。
  • trx_id >= max_trx_id:说明这条记录是这个Read View创建之后的事务生成的,不可见。
  • min_trx_id <= trx_id < max_trx_id
    • trx_idm_ids中:说明还未提交,不可见;
    • trd_id不在m_ids中,说明已经提交,可见。

如果当前事务需要访问的记录在事务的Read View中不可见,数据库会**尝试读取该记录的前一个可见版本**。这是因为每条记录都有一个版本链,保存了历史版本。数据库通过遍历版本链,找到事务可以看到的最新版本来返回给用户。

这种通过「版本链」来控制并发事务访问同一个记录时的行为就叫 MVCC(多版本并发控制)。

3.4 可重复读是怎么尽量解决幻读的?

可重复读无法彻底解决幻读问题,但是串行化的隔离级别会导致并发性能很差。因此InnoDB使用「可重复读」作为默认隔离级别,因为**「可重复读」可以很大程度上避免幻读现象**。

3.4.1 快照读和当前读

MySQL 里除了**普通查询(select)是快照读,其他都是当前读,比如 update、insert、delete,这些语句执行前都会查询最新版本的数据**,再做进一步的操作。

针对快照读,由于「可重复读」会在事务启动是就创建了Read View,后续的查询语句都是通过这个Read View来查询可见的数据。因此,「可重复读」隔离级别下的快照读不会产生幻读现象,MVCC方式可以解决幻读问题

3.4.2 当前读如何避免幻读?

对于当前读,因为每次执行的时候需要读取最新的数据,包括其他事务新提交的数据。所以可能会出现两次查询结果满足条件的记录数量不一致问题(幻读)。

为什么不会出现不可重复读现象?

因为可重复读隔离级别会在事务执行期间加记录锁,避免了记录被修改,可以完全解决不可重复读现象。但是无法完全解决幻读现象。

因此InnoDB引擎引出了**间隙锁**来解决这个问题。事务执行期间,除了对记录本身加锁外,还会对前面的间隙加锁,防止新的记录插入。例如:表中有一个范围 id 为(3,5)间隙锁,那么其他事务就无法插入 id = 4 这条记录了,这样就有效的防止幻读现象的发生。

总体来说,可重复读通过next-key锁(记录锁 + 间隙锁)来保证不会出现不可重复读现象,并尽量防止幻读现象的出现。

3.4.3 幻读被完全解决了吗?

可重复读隔离级别下虽然很大程度上避免了幻读,但是还是没有能完全解决幻读

下面这个场景也会发生幻读现象。

  • T1 时刻:事务 A 先执行「快照读语句」:select * from t_test where id > 100 得到了 3 条记录。
  • T2 时刻:事务 B 往插入一个 id= 200 的记录并提交;
  • T3 时刻:事务 A 再执行「当前读语句」 select * from t_test where id > 100 for update 就会得到 4 条记录,此时也发生了幻读现象。

原因是T1时刻是快照读,不会加锁,直接通过MVCC实现的读取。而T3时刻是当前读,读取了最新的数据。

资料参考

内容大多参考自:[图解MySQL介绍 | 小林coding (xiaolincoding.com)](

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值