【MySQL】MVCC 多版本并发控制
参考:
1、什么是MVCC
MVCC (Multiversion Concurrency Control),多版本并发控制。是通过数据行的多个版本管理来实现数据库的并发控制
。就是为了查询一些正在被另一个事务更新的行,并且可以看到它们被更新之前的值,这样在做查询的时候就不用等待另一个事务释放锁。
2、快照读和当前读
MVCC在MySQL InnoDB中的实现主要是为了提高数据库并发性能,用更好的方式去处理读-写冲突
,做到即使有读写冲突时,也能做到不加锁,非阻塞并发读
,而这个读指的就是快照读
, 而非当前读
。当前读实际上是一种加锁的操作,是悲观锁的实现。而MVCC本质是采用乐观锁思想的一种方式
2.1、快照读
快照读又叫一致性读,读取的是快照数据。 不加锁的简单的 SELECT 都属于快照读 ,即不加锁的非阻塞读
select * from order ...;
- 快照读在很多情况下,避免了加锁操作,降低了开销,提高了并发性能
- 快照读的实现是基于MVCC
- 快照读读取到的可能不是数据的最新版本,而有可能是之前的历史版本
- 快照读的前提是隔离级别不是串行,串行下快照读会退化为当前读
2.2、当前读
当前读读取的是记录的最新版本,读取时要保证其他并发事务不能修改当前记录,会对读取的记录进行加锁
select * from student lock in shore mode;
select * from student for update;
insert into student values(...);
delete from student where ...;
update student set ...;
3、InnoDB的隐藏字段和undo log版本链
InnoDB的聚簇索引中都包含两个隐藏字段
- trx_id:一个事务对聚簇索引记录进行改动时,都会把该事务的事务id赋值给trx_id
- roll_pointer:每次对某条聚簇索引记录进行改动时,都会把旧的版本写入到undo日志中,然后这个隐藏列就相当于一个指针,可以通过它来找到该记录修改前的信息
每次对记录进行改动,都会记录一条undo日志,每条undo日志也都有一个roll_pointer属性(INSERT操作对应的undo日志没有该属性,因为该记录并没有更早的版本),可以将这些undo日志都连起来,串成一个链表:
4、ReadView
MVCC的实现依赖于:隐藏字段、undo log、ReadView
4.1、什么是ReadView
ReadView就是事务在使用MVCC机制进行快照读时产生的读视图
。当事务启动时,会生成数据库系统当前的一个快照,InnoDB为每个事务构造了一个数组用来记录并维护系统当前活跃事务的ID(活跃值得是:启动了还没提交的事务)
4.2、ReadView中主要包含4个比较重要的内容
createor_trx_id
,创建这个ReadView 的事务idm_ids
,在生成ReadView时系统中活跃的事务的id列表min_trx_id
,活跃的事务中最小的事务idmax_trx_id
,表示生成ReadView时系统中应该分配给下一个事务的id值
注意: max_trx_id并不是m_ids中的最大值,事务id是递增分配的。比方说现在有id为1,2,3这三个事务,之后id为3的事务提交了。那么一个新的读事务在生成ReadView时,m_ids就包括1和2,min_trx_id的值就是1,max_trx_id的值就是4。
4.3、ReadView的访问规则
- 如果被访问版本的
trx_id
属性值与ReadView中的creator_trx_id
值相同,意味着当前事务在访问它自己修改过的记录,所以该版本可以被当前事务访问 - 如果被访问版本的
trx_id
属性值小于ReadView中的min_trx_id
值,表明生成该版本的事务在当前事务生成ReadView前已经提交,所以该版本可以被当前事务访问 - 如果被访问版本的
trx_id
属性值大于或等于ReadView中的max_trx_id
值,表明生成该版本的事务在当前事务生成ReadView后才开启,所以该版本不可以被当前事务访问 - 如果被访问版本的
trx_id
属性值在ReadView的min_trx_id
和max_trx_id
之间,那就需要判断一下trx_id属性值是不是在m_ids列表中,如果在,说明创建ReadView时生成该版本的事务还是活跃的,该版本不可以被访问;如果不在,说明创建ReadView时生成该版本的事务已经被提交,该版本可以被访问
4.4、ReadView的生成时机
READ UNCOMMITTED
:由于可以读到未提交事务修改过的记录,所以直接读取记录的最新版本就好了,不生成ReadViewSERIALIZABLE
:使用加锁的方式来访问记录,ReadViewREAD COMMITTED
:每次
读取数据前都生成一个ReadViewREPEATABLE READ
:在第一次
读取数据时生成一个ReadView,之后的查询操作都重复使用这个ReadView
5、小结
MVCC指的就是在使用READ COMMITTD、REPEATABLE READ这两种隔离级别的事务在执行普通的SELECT操作时访问记录的版本链的过程,这样子可以使不同事务的读-写、写-读操作并发执行,从而提升系统性能。
READ COMMITTD
在每一次进行普通SELECT操作前都会生成一个ReadViewREPEATABLE READ
只在第一次进行普通SELECT操作前生成一个ReadView,之后的查询操作都重复使用这个ReadView就好了
6、拓展: purge
- insert undo在事务提交之后就可以被释放了,而update undo由于还需要支持MVCC,不能立即删除
- 为了支持MVCC,对于delete mark操作来说,仅仅是在记录上打一个删除标记,并没有真正将它删除
随着系统的运行,在确定系统中包含最早产生的那个ReadView的事务不会再访问某些update undo日志以及被打了删除标记的记录后,有一个后台运行的purge线程会把它们真正的删除掉