MVCC,就是多版本并发控制。在数据库管理系统中,就是对数据库的并发访问。
在Mysql的InnoDB存储引擎中就是指,对于已提交读和可重复读这两种隔离级别下的事务,SELECT操作会访问版本链中的记录的过程。 这就使得别的事务可以修改这条记录,反正每次修改都会在版本链中记录,SELECT可以去版本链中拿记录,这就实现了读-写,写-读的并发执行,提升了系统的性能。
具体实现:
1.版本链
先讲一下版本链。在InnoDB存储引擎数据表中,它的聚簇索引记录中,有两个必要的隐藏列:
trx_id
用来存储对聚簇索引记录进行修改的事务id。
roll_pointer
每次对聚簇索引记录有修改的时候,都会把记录旧版本写入undo log中。这个roll_pointer就是存了一个指针,用来指向聚簇索引 记录的上一个版本,通过该指针可以获取上一个版本记录的信息。
2.ReadView
除了版本链,还有一个重要概念就是ReadView。
ReadView中有个列表来存储当前系统中活跃着的读写事务,也就是开始了但还未提交的事务。通过该列表可以判断 某个记录版本对当前事务是否可见。假设当前列表里的事务id最小为40, 最大为50。
一、如果你要访问的记录版本的事务id比当前列表最小的id小,那说明该事务在当前readview生成之前就已经提交了,所以该记录版本对当前活动的事务来说是可访问的。
二、如果你要访问的记录版本的事务id在当前列表的最小id和最大id之间,那就再判断一下是否在列表内,如果在那就说明该事务还未提交,所以记录版本不能被访问。如果不在那说明该事务已经提交了,所以记录版本可以被访问。
三、如果你要访问的记录版本的事务id比当前列表最大的id大,那说明该事务是在当前readview生成之后提交的,所以记录版本对当前活动的事务来说是不可访问的。
实际上,事务访问记录都是去版本链里面找的,先找最近的记录版本,然后判断该记录版本的事务id是否符合readview中列表的条件,如果不符合的话,再去找上一个记录版本再进行判断,直到返回可见的记录版本或者结束。
已提交读和可重复读的区别就在于它们生成ReadView的策略不同。已提交读隔离级别下的事务在每次查询的时候都会生成一个独立的ReadView。而可重复读隔离级别只会在第一次查询的时候生成一个ReadView,之后每次查询都复用之前的ReadView。
这就是Mysql的MVCC,通过版本链实现多版本以及并发读-写,写-读。通过ReadView生成策略的不同实现不同的隔离级别。