本文属于读书笔记,摘抄于《高性能MYSQL》,摘抄内容版权属于原作者。
mysql的大多数事务型存储引擎实现的都不是简单的行级锁。基于提升并发性能的考虑,他们一般都同事实现了多版本并发控制。不仅是mysql, oracle, postgresql等其他数据库系统也都实现了mvcc,但各自的实现机制不尽相同,因为mvcc没有一个统一的实现标准。
可以认为mvcc是行级锁的一个变种,但是它在很多情况下避免了枷锁操作,因此开销更低。虽然实现即时有所不同,但是大多实现了非阻塞的读操作,写操作也只锁定必要的行。
MVCC的实现是通过保存数据在某个时间点的快照来实现的。也就是说,不管需要执行多长时间,每个事务看到的数据都是一致的。根据事务开始的时间不同,每个事务对同一张表,同一个时刻看到的数据可能不一样的。
前面说到的不同存储引擎的MVCC实现是不同的,典型的有乐观并发控制和悲观并发控制。
InnoDB的MVCC,是通过每行记录后面保存的两个隐藏的列来实现的。这两个列,一个保存了行的创建时间,一个保存行的过期时间(或者删除时间)。当然存储的并不是实际的是兼职,而是系统的版本号。每开始一个新的事务,系统的版本号都会自动递增。事务开始时刻的系统版本号会作为事务的版本号,用来和查询到的每行记录的版本号进行比较。
以下是REPEATABLE READ隔离级别下,MVCC具体是如何操作的
SELECT
a. InnoDB只查找版本遭遇当前事务版本的数据行(也就是,行的系统版本小于或等于事务的系统版本号),这样可以确保事务读取的行,要么是在事务开始前已经存在的,要么是事务自身插入或者修改改过的。
b. 行的删除版本要么未定义,要么大于当前事务版本号。这可以确保事务读取到的行,是事务开始之前未被删除的。
INSERT
InnoDB为新插入的每一行保存当前系统版本号作为行版本号。
DELETE
InnoDB为删除的每一行保存当前系统版本号作为行删除标识。
UPDATE
InnoDB为插入一行新记录,保存当前系统版本号作为行版本号,同事保存当前系统版本号到原来行作为行删除标识。
保存这两个额外的系统版本号,使大多数读操作都可以不用枷锁。这样设计使得读数据操作很简单,性能很好,并且也能保证只会读取到符合标准的行。不足之处是每行记录都需要额外的存储空间,需要做更多的航检查工作,以及一些额外的维护工作。
MVCC只在REPEATABLE READ和READ COMMITTED两个隔离级别下工作。其他的两个隔离级别都和MVCC不兼容,因为READ UNCOMMITTED总是读取到最新的数据行,而不是符合当前事务版本的数据行。