MySQL MVCC
MySQL 的大多数事务型存储引擎实现的都不是简单的行级锁,基于提高并发性的考虑,它们一般都同时实现了多个版本并发控制(MVCC)。不仅是MySQL,包括Orcale,PostgreSQL等其他数据库系统也都实现了MVCC,但是它们的实现机制不尽相同,因为MVCC没有一个统一的标准。
可以认为MVCC是行级锁的一个变种,但是它在很多情况下可以避免加锁操作,因此开销更低。虽然各个数据库管理系统实现MVCC的机制不尽相同,但大都实现了非阻塞的读操作,写操作也只是锁定必要的行。
在MySQL中,MVCC的实现是通过保存数据在某个时间点的快照来实现的。也就是说,不管需要执行多长时间,每个事务看到的数据都是一致的。根据事务开始时间的不同,每个事务对同一张表,同一时刻看到的数据可能不一样。
不用存储引擎的MVCC的实现不尽相同,典型的有乐观(optimistic)并发控制和悲观(pessimistic)并发控制。下面我们通过InnoDB存储引擎来说明,MySQL的MVCC是如何工作的。
InnoDB的MVCC,是通过每条记录后面保存两个隐藏列来实现的。这两个列,一个保存行的创建时间,另一个保存行的过期时间(删除时间)。当然存储的不是实际的时间,而是系统版本号(system version number)。每开始一个事务,系统版本号都会自动递增。下面我们看一下在REPEATABLE READ隔离级别下,InnoDB MVCC是如何操作的。
SELECT
InnoDB 会根据以下两个条件检查每行记录
a. InnoDB只查找版本早于当前事务版本的行数(也就是,行的系统版本号小于或等于事物的系统版本号),这样可以确保事务读取的行,要么是事务开始前已经存在,要么是事务自身插入或者修改的。
b. 行的删除版本要么未定义,要么大于当前事务版本号。这样可以确保事务读取到的行,在事务开始前没有被删除。INSERT
InnoDB为新插入的每一行保存当前的系统版本号作为行版本号。- DELETE
InnoDB为删除的每一行保存当前的系统版本号作为删除版本号。- UPDATE
InnoDB为新插入的每一行保存当前的系统版本号作为行版本号,同时保存当前版本号直到原来的行作为删除标识。保存两个额为的系统版本号,大多数的读操作都可以不加锁。这样的设计使得读数据操作变得更简单,性能很好,并且也能保证只会读取到符合标准的行。不足之处是每行记录都需要额外的存储空间,需要做更多的行检查工作,以及一些额为的维护工作。
MVCC只在 REPEATABLE READ和READ COMMITTED两种隔离级别下工作。其他两种隔离级别都与MVCC不兼容,因为READ UNCOMMITTED总数读取最新的数据行,而不符合当前事务版本的数据行。而SERIALIZABLE则会对所有读取的行都加锁。