mysql在可重复读隔离级别下,如何保证事务较高的隔离性,靠的是MVCC((Multi-Version Concurrency Control)机制来保证的。
对一行数据的读和写两个操作默认 是不会通过加锁互斥来保证隔离性,避免了频繁加锁互斥,而在串行化隔离级别为了保证较高的隔离性是通过将所有操 作加锁互斥来实现的。
mysql隔离级别(读已提交和可重复读)都实现了MVCC机制。
mvcc机制其实是靠undo回滚日志和readview一致性视图来实现的。
undo回滚日志版本链
是指一行数据被多个事务一次修改过后,在事务修改完后,mysql会保留修改前的数据和修改后的数据到undo回滚日志,并添加两个字段trx_id(事务id)和roll_pointer(修改前的数据的指针)把这些undo日志串联起来形成一个历史记录版本链。
在可重复读隔离级别中,开启事务,执行任何查询sql的时候会生成当前事务的一致性视图
(read-view),并且这个视图在事务结束提交之前都不会改变。如果是已提交读隔离级别,每次执行查询sql都会重新生成read-view。
read-view组成:由一个存放所有未提交的事务id组成的数组(最小事务id为min_id)+已创建的最大的事务id(max_id)组成。
如上图所示:
事务小于read-view数组中min_id(read_view数组最小值为100)在绿色范围内,表示已提交事务。
事务大于最大提交事务id(max_id),图中是300,表示还未开始的事务。在红色范围
事务在 [100-300] 之间表示所有未提交的事务数组[100,200],已提交的最大事务300。黄色范围
事务里的查询sql结果都需要从对应的undo版本链里最新数据逐条跟read-view做对比,来得到最终的查询结果。
版本链比对规则
1、如果row的trx_id落在绿色范围(trx_id<min_id),表示已提交事务生成的,这个数据可见。
2、如果row的trx_id落在红色范围(trx_id>max_id),表示还未创建的事务生成的,是不可见的,(若 row 的 trx_id 就是当前自己的事务是可见的)。
3、如果row的trx_id落在黄色范围(min_id <=trx_id<= max_id),这种情况分为两种:
(1)若row的trx_id在read-view视图数组中,表示还未提交的事务生成的。不可见(若trx_id是当前自己的事务是可见的)。
(2)若row的trx_id不在read-view视图数组中,表示事务已经提交,可见。
对于删除的事务情况,认为是update的特殊情况,会在版本链上复制一条最新的数据,然后将trx_id修改成删除操作的trx_id,同时在该条记录的头信息(record header)里的delete_flag标志位改成true,来表示当前记录已经被 删除,在查询时按照上面的规则查到对应的记录如果delete_flag标记位为true,意味着记录已被删除,则不返回数 据。
在操作中,begin /start transaction命令并不是事务的起点,只有在执行到第一条修改操作的sql语句时候才会真正意义的开启事务,才会向mysql申请事务id,mysql内部是严格按照事务的启动顺序来分配事务id的。
总结
MVCC机制的实现就是通过read-view机制与undo版本链比对机制,使得不同的事务会根据数据版本链对比规则读取 同一条数据在版本链上的不同版本数据。