事务到底是隔离的还是不隔离的？

最新推荐文章于 2023-06-09 15:49:28 发布

发飙的蜗牛咻咻咻~

最新推荐文章于 2023-06-09 15:49:28 发布

阅读量398

点赞数 4

分类专栏： ★ MySQL 实战文章标签： MVCC 一致性读视图当前读

huadong

本文链接：https://blog.csdn.net/qq_36221788/article/details/103268539

版权

★ MySQL 实战专栏收录该内容

24 篇文章 1 订阅

订阅专栏

文章目录

场景描述
事务启动方式
什么是 MVCC
“快照”在 MVCC 里是怎么工作的？
更新数据
事务的可重复读的能力是怎么实现的？
回滚日志（undo log）

场景描述

先举一个例子，下面是一个只有两行的表的初始化语句

mysql> CREATE TABLE `t` (
  `id` int(11) NOT NULL,
  `k` int(11) DEFAULT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB;
insert into t(id, k) values(1,1),(2,2);

事务 A、B、C 的执行流程
这时，如果告诉你事务 B 查到的 k 的值是 3，而事务 A 查到的 k 的值是 1，你是不是感觉有点晕呢？这篇文章就来说明这个问题。

事务启动方式

begin/start transaction 命令并不是一个事务的起点，在执行到它们之后的第一个操作 InnoDB 表的语句，事务才真正启动。如果你想要马上启动一个事务，可以使用 start transaction with consistent snapshot 这个命令。
- 第一种启动方式，一致性视图是在执行第一个快照读语句时创建的。
- 第二种启动方式，一致性视图是在执行 start transaction with consistent snapshot 时创建的。
在 MySQL 里，有两个“视图”的概念
- 一个是 view，开发中经常使用的视图。它是一个用查询语句定义的虚拟表，在调用的时候执行查询语句并生成结果。创建视图的语法是 create view … ，它的查询方式与表一样。
- 另一个是 InnoDB 在实现 MVCC 时用到的一致性读视图，即 consistent read view，用于支持 RC（Read Committed，读提交）和 RR（Repeatable Read，可重复读）隔离级别的实现。它没有物理结构，作用是事务执行期间用来定义“我能看到什么数据”。

什么是 MVCC

在 MySQL 中，实际上每条记录在更新的时候都会同时记录一条会对操作。记录上的最新值，通过回滚操作，都可以得到前一个状态的值
假设一个值从 1 被按顺序改成了 2、3、4，在回滚日志里面就会有类似下面的记录：
当前值是 4，当时在查询这条记录的时候，不同时刻启动的事物会有不同的 read-view。如图中看到的，在视图 A、B、C 里面，这一个记录的值分别是 1、2、4，同一条记录在系统中可以存在多个版本，就是数据库的多版本并发控制（MVCC）。

“快照”在 MVCC 里是怎么工作的？

InnoDB 里面每个事务有一个唯一的事务 ID，叫作 transaction_id。它是在事务开始的时候向 InnoDB 的事务系统申请的，是按申请顺序严格递增的。
而每行数据也都是有多个版本的，每次事务更新数据的时候，都会生成一个新的数据版本，并且把 transaction_id 赋值给这个数据版本的事务 ID，记为 row trx_id。同时，旧的数据版本要保留，并且在新的数据版本中，能够有信息可以直接拿到它。也就是说，数据表中的一行记录，其实可能有多个版本 (row)，每个版本有自己的 row trx_id。

按照可重复读的定义，一个事务启动的时候，能够看到所有已经提交的事务结果。但是之后，这个事务执行期间，其他事务的更新对它不可见。
因此，一个事务只需要在启动的时候声明说，“以我启动的时刻为准，如果一个数据版本是在我启动之前生成的，就认；如果是我启动以后才生成的，我就不认，我必须要找到它的上一个版本”。
当然，如果“上一个版本”也不可见，那就得继续往前找。还有，如果是这个事务自己更新的数据，它自己还是要认的。

在实现上， InnoDB 为每个事务构造了一个数组，用来保存这个事务启动瞬间，当前正在“活跃”的所有事务 ID。“活跃”指的就是，启动了但还没提交。
数组里面事务 ID 的最小值记为低水位，当前系统里面已经创建过的事务 ID 的最大值加 1 记为高水位。这个视图数组和高水位，就组成了当前事务的一致性视图（read-view）。
这样，对于当前事务的启动瞬间来说，一个数据版本的 row trx_id，有以下几种可能：
- 如果落在绿色部分，表示这个版本是已提交的事务或者是当前事务自己生成的，这个数据是可见的。
- 如果落在红色部分，表示这个版本是由将来启动的事务生成的，是肯定不可见的。
- 如果落在黄色部分，那就包括两种情况
  - a. 若 row trx_id 在数组中，表示这个版本是由还没提交的事务生成的，不可见。
  - b. 若 row trx_id 不在数组中，表示这个版本是已经提交了的事务生成的，可见。
所以，InnoDB 利用了“所有数据都有多个版本”的这个特性，实现了“秒级创建快照”的能力。

更新数据

事务 B 的 select 语句，如果按照一致性读，好像结果不对哦？结果也应该是 1 才对，这是怎么回事？

其实这里用到了这样一条规则：更新数据都是先读后写的，而这个读，只能读当前的值，称为“当前读”（current read），就是读取最新的已经提交的数据，当前读有以下场景：
- select...lock in share mode：IS 锁（共享锁），即在符合条件的 rows 上都加了共享锁，这样的话，其他事务可以读取这些记录，也可以继续添加 IS 锁，但是无法修改这些记录直到你这个加锁的事务执行完成。
- select...for update：IX 锁（排它锁），即在符合条件的 rows 上都加了排它锁，其他事务也就无法在这些记录上添加任何的 IS 锁或 IX 锁。如果不存在一致性非锁定读的话，那么其他事务是无法读取和修改这些记录的。
- update、delete、insert：执行这些操作时默认加上排它锁
当它要去更新数据的时候，就不能再在历史版本上更新了，否则事务 C 的更新就丢失了。因此，事务 B 此时的 set k=k+1 是在（1,2）的基础上进行的操作。
其实，除了 update 语句外，select 语句如果加锁，也是当前读。
再往前一步，假设事务 C 不是马上提交的，而是变成了下面的事务 C’，会怎么样呢？
这时候，我们在上一篇文章中提到的“两阶段锁协议”就要上场了。事务 C’没提交，也就是说 (1,2) 这个版本上的写锁还没释放。而事务 B 是当前读，必须要读最新版本，而且必须加锁，因此就被锁住了，必须等到事务 C’释放这个锁，才能继续它的当前读。

事务的可重复读的能力是怎么实现的？

现在，我们再回到文章开头的问题：事务的可重复读的能力是怎么实现的？

可重复读的核心就是一致性读（consistent read）；而事务更新数据的时候，只能用当前读。如果当前的记录的行锁被其他事务占用的话，就需要进入锁等待。
而读提交的逻辑和可重复读的逻辑类似，它们最主要的区别是：
- 在可重复读隔离级别下，只需要在事务开始的时候创建一致性视图，之后事务里的其他查询都共用这个一致性视图
- 在读提交隔离级别下，每一个语句执行前都会重新算出一个新的视图

回滚日志（undo log）

两个作用：提供回滚和多个行版本控制（MVCC）。
在数据修改的时候，不仅记录了 redo log，还记录了相对应的 undo log，如果因为某些原因导致事务失败或回滚了，可以借助该 undo log 进行回滚。
undo log 和 redo log 记录物理日志不一样，它是逻辑日志。可以认为当 delete 一条记录时，undo log 中会记录一条对应的 insert 记录，反之亦然，当 update 一条记录时，它记录一条对应相反的 update 记录。
当执行 rollback 时，就可以从 undo log 中的逻辑记录读取到相应的内容并进行回滚。
应用到事务多版本并发控制的时候，也是通过 undo log 来实现的：当读取的某一行被其他事务锁定时，它可以从 undo log 中分析出该行记录以前的数据是什么，从而提供该行版本信息，让用户实现非锁定一致性读取。
undo log 是采用段（segment）的方式来记录的，每个 undo log 操作在记录的时候占用一个 undo log segment。