MVCC(Multiversion Concurrency Control,多版本并发控制):提供并发访问数据库时,对事务内读取到的内存做处理,用来避免写操作阻塞读操作的并发问题。
与MVCC相对的是基于锁的并发控制(Lock-Based Concurrency Control)。MVCC最大优势是:读不加锁,读写不冲突。在读多写少的OLTP应用中,读写不冲突是非常重要的,极大的增加了系统的并发性能。
相关概念
- 隐藏列
InnoDB存储引擎在数据库每行数据的后面添加了三个字段:
- 6字节的事务ID(DB_TRX_ID)字段:用来标识最近一次对本行记录做修改的事务的标识符,即最后一次修改本行记录的事务id;
- 7字节的回滚指针(DB_ROLL_PTR)字段:写入回滚段的undo log record;表示指向该行回滚段的指针,该行上所有旧的版本,在undo log中都是通过链表的形式组织,该值正是指向undo log中该行的历史记录链表;
- 6字节的DB_ROW_ID字段:包含一个随着新行插入而单调递增的行ID,当由InnoDB存储引擎自动产生聚簇索引时,聚簇索引会包含这个行ID的值,否则这个行ID不会出现在任何索引中;
- 事务链表
MySQL中的事务在开始到提交这段过程中,都会被保存在一个叫trx_sys的事务链表中,这是一个基本的链表结构:
事务链表中保存的都是还未提交的事务,事务一旦提交,则会从事务链表中删除。
- ReadView
MySQL实现MVCC的关键 —— ReadView,就是一个数据结构,在SQL开始的时候被创建,这个数据结构包含3个主要的成员:ReadView{low_trx_id,up_trx_id,trx_ids}。在并发情况下,一个事务在启动时,trx_sys链表中存在部分还未提交的事务,那么哪些改变对当前的事务是可见的,哪些是不可见的,这个需要通过ReadView来进行判定。【注】:已提交读和可重复读的区别就在于它们生成ReadView的策略不同。下面简单描述一下ReadView中3个成员的含义:
- low_trx_id:表示该SQL启动时,当前事务链表中最大的事务id编号,也就是最近创建的除自身以外的最大事务编号;
- up_trx_id:表示该SQL启动时,当前事务链表中最小的事务id编号,也就是当前系统中创建最早但还未提交的事务编号;
- trx_ids:表示所有事务链表中事务id的集合。
上面3个ReadView的组成成员简易示意图如下:
【说明】:① 所有数据行上trx_id小于up_trx_id的记录,说明修改该行的事务在当前事务开启之前就已经提交完成了,所以对当前事务来说,都是可见的。② 对于trx_id大于low_trx_id的记录,说明修改该行记录的事务在当前事务之后,所以对于当前事务来说,都是不可见的。③ ReadView是与SQL绑定的,而不是事务,所以即使在同一个事务中,每次SQL启动时构造的ReadView的up_trx_id和low_trx_id也都是不一样的。④ 对于位于(up_trx_id,low_trx_id)之间的事务是否可见,需要根据不同的事务隔离级别进行判断。对于RC的事务隔离级别来说,对于事务执行过程中,已经提交的事务的数据,对当前事务是可见的,也就是说上述图中,当前事务运行过程中,trx1~4中任意一个事务提交,对当前事务来说都是可见的;而对于RR隔离级别来说,事务启动时,已经开始的事务链表中的事务的所有修改都是不可见的,所以在RR级别下,low_trx_id基本保持与up_trx_id相同的值即可。
MySQL中MVCC实现
引用 @温正湖 的一张图解释MySQL中MVCC实现过程:
案例演示
演示一个简易版的事务对某行记录的更新过程:
一些补充
- 当前读 & 快照读
MySQL的InnoDB存储引擎默认事务隔离级别是可重复读(RR),是通过“行排他锁 + MVCC”实现的,不仅可以保证可重复读,还可以部分防止幻读。
部分防止幻读而非完全防止的原因:① 如果事务B在事务A执行中,INSERT一条数据并提交,事务A再次查询,虽然读取的是undo log中的旧版本数据,但是事务A中执行UODATE或者DELETE都是可以成功的;② 在InnoDB存储引擎中的读操作可以分为当前读(CR)和快照读(SR)。
- 快照读(Snapshot Read)
就是简单的SELECT读,不包括【SELECT ... LOCK IN SHARE MODE, SELECT ... FOR UPDATE】
- 当前读(Current Read)
【SELECT ... LOCK IN SHARE MODE】
【SELECT ... FOR UPDATE】
【INSERT、UPDATE、DELETE】
【注意】:在RR隔离级别下,快照读是通过MVCC和undo log实现的;当前读是通过加Record Lock记录锁和Gap Lock间隙锁实现的,即添加Next-Key Lock锁。InnoDB存储引擎在快照读的情况下并没有真正的避免幻读,但是在当前读的情况下避免了不可重复读和幻读。
往期精彩文章:
MySQL系列之事务隔离级别
MySQL系列之数据库锁
MySQL系列之数据库索引