MySQL 事务详解

事务是什么?

多个操作同时进行,要么同时成功,要么同时失败。这就是事务。

事务有四个特性:一致性、持久性、原子性、隔离性:

  • 原子性:事务是一个不可分割的工作单位,要么同时成功,要么同时失败。

  • 持久性:一旦事务提交,对数据库的改变就是永久的。

  • 隔离性:多个事务之间相互隔离的,互不干扰。

  • 一致性:事务执行接收之后,数据库完整性不被破坏。

MySQL 的隔离级别

MySQL 的隔离级别有以下 4 种:

  • 读未提交(read uncommitted):一个事务还没提交时,它做的变更就能被别的事务看到。
  • 读提交(read committed):一个事务提交之后,它做的变更才会被其他事务看到。
  • 可重复读(repeatable read):一个事务执行过程中看到的数据,总是跟这个事务在启动时看到的数据是一致的。当然在可重复读隔离级别下,未提交变更对其他事务也是不可见的。
  • 串行化(serializable):对于同一行记录,“写”会加“写锁”,“读”会加“读锁”。当出现读写锁冲突的时候,后访问的事务必须等前一个事务执行完成,才能继续执行。

事务隔离的实现

在MySQL中,每条记录在更新的时候都会同时记录一条回滚操作。记录上的最新值,通过回滚操作,都可以得到前一个状态的值。同一条记录在系统中可以存在多个版本,就是数据库的多版本并发控制(MVCC)。

不同时刻启动的事务会有不同的 read-view。系统会判断,当没有事务再需要用到这些回滚日志时,回滚日志会被删除。当系统里没有比这个回滚日志更早的read-view的时候就不需要这个回滚日志了。

以可重复读隔离级别为例,事务 T 启动的时候会创建一个视图 read-view,之后事务 T 执行期间,即使有其他事务修改了数据,事务 T 看到的仍然跟在启动时看到的一样。

在MySQL里,有两个“视图”的概念:

  • 一个是view。它是一个用查询语句定义的虚拟表,在调用的时候执行查询语句并生成结果。创建视图的语法是create view … ,而它的查询方法与表一样。
  • 另一个是 InnoDB 在实现 MVCC 时用到的一致性读视图,用于支持RC(Read Committed,读提交)和RR(Repeatable Read,可重复读)隔离级别的实现。

它没有物理结构,作用是事务执行期间用来定义“我能看到什么数据”。

访问数据的时候以视图的逻辑结果为准

  • “读未提交”隔离级别下直接返回记录上的最新值没有视图概念
  • 在**“可重复读”隔离级别下,这个视图是在事务启动时创建**的,整个事务存在期间都用这个视图。
  • 在**“读提交”隔离级别下,这个视图是在每个SQL语句开始执行时创建**。
  • 而**“串行化”隔离级别下直接用加锁的方式**来避免并行访问。

“快照”在MVCC里是怎么工作的?

在可重复读隔离级别下,事务在启动的时候就“拍了个快照”。这个快照是基于整库的

这个快照的实现原理

InnoDB 里面每个事务有一个唯一的事务ID,称为 transaction id。在事务开始的时候它向 InnoDB 的事务系统申请的,并且它是按申请顺序严格递增的。而每行数据也都有多个版本。每次事务更新数据的时候,都会生成一个新的数据版本,并且把 transaction id 赋值给这个数据版本的事务ID,记为 row trx_id。同时,旧的数据版本要保留,并且在新的数据版本中,能够有信息可以直接拿到它。即数据表中的一行记录,其实可能有多个版本(row),每个版本有自己的 row trx_id。

按照可重复读的定义,一个事务启动的时候,能够看到所有已经提交的事务结果。但是之后,这个事务执行期间,其他事务的更新对它不可见。因此,一个事务的数据版本以启动的时刻为准,如果一个数据版本是在启动之前生成的,就认;如果是启动以后才生成的,就不认,必须要找到它的上一个版本。如果上一个版本也不可见,那就得继续往前找。如果是这个事务自己更新的数据,还是要认的。

在实现上, InnoDB 为每个事务构造了一个数组,用来保存这个事务启动瞬间,当前正在“活跃”的所有事务ID。“活跃”指的就是,启动了但还没提交,这个数组通常称为 m_ids

数组里面事务ID的最小值记为 min_trx_id,当前系统里面已经创建过的事务ID的最大值加1记为 max_trx_id

这个视图数组和高水位,就组成了当前事务的一致性视图(read-view)。

数据版本的可见性规则,就是基于数据的 row trx_id 和这个一致性视图的对比结果得到的。

这个视图数组把所有的 row trx_id 分成了几种不同的情况。

在这里插入图片描述

一个数据版本的 row trx_id,有以下几种可能:

  • 如果落在绿色部分,即 trx_id 小于 min_trx_id,表示这个版本是已提交的事务或者是当前事务自己生成的,这个数据是可见的;
  • 如果落在红色部分,即 trx_id 大于 max_trx_id ,表示这个版本是由将来启动的事务生成的,是不可见的;
  • 如果落在黄色部分,分为两种情况:
    • 若 row trx_id 在 m_ids 数组中,表示这个版本是由还没提交的事务生成的,不可见;
    • 若 row trx_id 不在 m_ids 数组中,表示这个版本是已经提交了的事务生成的,可见。

一个数据版本,对于一个事务视图来说,除了自己的更新总是可见以外,有三种情况:

  1. 版本未提交,不可见;
  2. 版本已提交,但是是在视图创建后提交的,不可见;
  3. 版本已提交,而且是在视图创建前提交的,可见。

长事务

长事务意味着系统里面会存在很老的事务视图。由于这些事务随时可能访问数据库里面的任何数据,所以这个事务提交之前,数据库里面它可能用到的回滚记录都必须保留,这就会导致大量占用存储空间。

在MySQL 5.5及以前的版本,回滚日志是跟数据字典一起放在ibdata文件里的,即使长事务最终提交,回滚段被清理,文件也不会变小。

除了对回滚段的影响,长事务还占用锁资源,也可能拖垮整个库。

所以建议尽量不要使用长事务。

如何启动事务

启动事务一般有两种方式

方式一:显式启动事务语句, begin 或 start transaction。提交语句是commit,回滚语句是rollback。

方式二:set autocommit=0,这个命令会将这个线程的自动提交关掉。即如果只执行一个select语句,这个事务就启动了,而且并不会自动提交。这个事务持续存在直到你主动执行 commit 或 rollback 语句,或者断开连接。

建议使用 set autocommit=1, 通过显式语句的方式来启动事务。

同时可以在 information_schema 库的 innodb_trx 这个表中查询长事务。

参考资料

《MySQL 必知必会》

《MySQL 45讲》

《 JavaGuide 》

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值