Mysql事务(MVCC实现机制详解)
事务
什么是事务
- 一个最小的不可再分的工作单元,每个事务可由一个或多个SQL语句组成。
Mysql在Innodb引擎下才支持事务并且默认每条语句都是一个事务。
事务的四大特性
- 原子性:指一个事务是一个不可分割的工作单位,其中的操作要么都做,要么都不做。
当事务发现有些语句不能执行时,需要将数据恢复到事务执行前,通过undo log实现。 - 持久性:指事务一旦提交,它对数据库的改变就应该是永久性的。接下来的其他操作或故障不应该对其有任何影响。
持久性问题的产生:
背景:Mysql为了保证存储效率,每次读写文件都是先对缓存池(Buffer Pool)操作,缓冲池再定期刷新到磁盘中(这一过程称为刷脏)。
产生:由于数据不是直接写到磁盘,那么如果主机断电,就会有一部分数据丢失。
解决:通过重做日志(redo log)恢复数据。在每次修改数据之前,都会将相应的语句写到redo log中,如果主机断电,那么再次启动时可通过redo log回复。
拓展:redo log也需要在事务提交时将日志写入磁盘,它比缓冲池写入快的原因有两点:redo log是追加文件写,属于顺序IO,缓冲池是属于随机IO,且刷脏是以页为单位,有一点修改就要整页写入。 - 隔离性:隔离性是指,事务内部的操作与其他事务是隔离的,并发执行的各个事务之间不能互相干扰。
与原子性、持久性侧重于研究事务本身不同,隔离性研究的是不同事务之间的相互影响。
下边讲到的事务并发问题就是隔离性的问题,MVCC就是解决这些问题的。 - 一致性:指事务执行结束后,数据库的完整性约束没有被破坏,事务执行的前后都是合法的数据状态。
实现:前面提到的原子性、持久性和隔离性,都是为了保证数据库状态的一致性。
事务的并发问题
-
脏读:事务A读取到了事务B修改但未提交的数据。
-
不可重复度: 事务A查询同一条语句的前后结果不一样。
-
幻读:事务A条件查询同一语句前后两次结果不一样。
事务的隔离等级
- 事务的隔离等级越高,解决并发产生的问题越多,相应的执行效率也就越低
背景知识:读锁和写锁,在读数据时上读锁,在写数据时上写锁。
数据上读锁后不能被其他事务修改,知道读锁释放,数据上写锁其他事务不能读也不能修改。
-
读未提交:事务能读取其他事务未提交的数据。不检查任何锁
三种并发问题都没结局。 -
读已提交(锁在读后释放):事务只能读取其他事务已经提交的数据。
解决脏读。 -
可重复度(默认隔离等级)(锁在事务后释放):事务只能读取其他事务已经提交的数据。
解决不可重复读。
-
串行化:将事务强制以穿行的方式执行,就不会有并发发生。也使得数据库效率极低。
MVCC
什么是MVCC
刚才在上边讲的读已提交和可重复读都是已锁的方式实现的,MVCC是不加任何锁实现这两种隔离等级,并且MVCC在读已提交等级下解决的大部分幻读问题。因为没有锁,所以效率极高。
MVCC是通过Read View + undo log 实现的
MVCC实现所用到的技术及手段
1. 两个隐藏列trx_id、roll_pointer
在每条数据后边都会有这两个隐藏列。
trx_id表示该条数据的版本号。
roll_pointer像一个指针,指向该条数据上一次的版本。
2. 事务版本号
每个事务都会按顺序递增的分配一个版本号,通过此事务修改的数据都会把数据的trx_id修改成当前版本号。
3. 回滚日志(undo log)
保证原子性和一致性,用于MVCC的快照读(后边有介绍快照读)。
4. 读视图(read view)
先来介绍两个概念,快照读和当前读
- 快照读:能从undo log中读取数据,也就是说能读取旧数据。不加锁,普通的select都是快照读。
- 当前读:读取的记录是最新版本,显示加锁都是当前读。
read view:在读已提交模式下,每条SQL语句生成一个读视图。在可重复读模式下,一个事务用一个读视图。用来判断当前事务可见的该条数据的版本。
-
Read View的几个变量,通过这些变量来确定数据是否可见。
- m_ids:通过链表记录着当前系统正在执行的事务版本号。
- min_limit_id:表示在生成Read View时,当前系统中活跃的读写事务中最小的事务版本号,即m_ids中的最小值。
- max_limit_id:表示生成Read View时,系统中应该分配给下一个事务的版版本号。如当前最新事务版本号为100(可能执行完可能正在执行),那么max_limit_id=101。
- creator_trx_id: 创建当前Read View的事务版本号
-
Read view 匹配条件规则如下:
MVCC具体工作流程(重点)
查询流程
1. 开始前系统顺序分配事务自己的版本号,即事务ID
2. 获取Read View
2. 查询得到的数据,然后Read View中的事务版本号进行比较。
3. 如果不符合Read View的可见性规则, 即就需要Undo log中历史快照;
4. 最后返回符合规则的数据
MVCC实现读已提交:
MVCC实现可重复读:
MVCC在可重复读模式下避免了部分的幻读:
如果是快照读数据,是不会发生幻读的。
如果是当前读,就有可能发生幻读,因为当前读都是读取最新的版本数据,Read View的可见性匹配规则就是功能。