mvcc(多版本并发控制)
-
MVCC 是通过数据行的多个版本管理来实现数据库的并发控制 。使得在InnoDB的事务隔离级别下执行 一致性读操作有了保证。可以认为是行级锁的变种,在很多情况下可以避免加锁,开销更低
-
mvcc没有正式的标准,不同数据库实现方式不一样,也不是普遍使用的,mysql也只有innodb使用了mvcc
-
mvcc只适用于可重复读 ,和读已提交两个隔离级别,
- 因为读未提交查询并不会读取适合事务版本的行版本,而是每次都读取最新的版本,也就是当前读
- 串行化不兼容是因为读会锁定返回的每一行
快照度和当前读
-
快照读
- MVCC能用更好的方式去处理 读-写冲突 ,做到即使有读写冲突时,也能做到不加锁 , 非阻塞并发读 ,而这个读指的就是快照读
- 快照读又叫一致性读,读取的是快照数据。不加锁的简单的 SELECT 都属于快照读
-
当前读
- 当前读实际上是一种加锁的操作,是悲观锁的实现。而MVCC本质是采用乐观锁思想的一种方式。
- 当前读读取的是记录的最新版本(最新数据,而不是历史版本的数据),读取时还要保证其他并发事务不能修改当前记录,会对读取的记录进行加锁。例如对数据进行增删改都会进行当前读。
mvcc的实现原理
-
mvcc 依赖于隐藏列、undo日志和 Read View
-
innodb的隐藏字段
- trx_id 事务id,每一个事务对某条聚簇索引进行修改时,就会把该事务的id赋值给trx_id
- roll_pointer 每次对某条聚簇索引进行改动时,都会把旧的版本写入到undo日志中,随着修改次数的增加,所有的旧版本都会被roll_pointer连接成一个链表,称为版本链,版本链的头节点就是当前最新数据,这个隐藏列相当于一个指针,可以通过它来找到修改前的信息
-
Read View
- Read View就是在使用mvcc机制进行快照读操作产生的读视图,当事务启动就会生成数据库系统当前的快照
- innodb为每个事务都构建了一个数组,用来记录并维护系统当前活跃的事务id,也就是未提交的事务
- 因为 mvcc只适用于可重复读 ,和读已提交两个隔离级别,所以Read View只适用于这两个隔离级别,主要作用就是判断版本链中的哪个版本是当前事务可见的
- Read View包含四部分:
- creator_trx_id ,创建这个 Read View 的事务 ID,只有在对表中的记录做改动时才会为事务分配事务id,否则在一个只读事务中的事务id值都默认为0。
- trx_ids ,表示在生成ReadView时当前系统中活跃的(启动了,但是还没有提交)读写事务的事务id列表 。
- up_limit_id ,活跃的事务中最小的事务 ID。
- low_limit_id ,表示生成ReadView时系统中应该分配给下一个事务的 id 值。也就是系统最大的事务id值,并不是正在活跃的事务ID。
- 执行规则,如何判断记录的某个版本是否可见:
- 如果被访问版本的trx_id属性值与ReadView中的 creator_trx_id 值相同,意味着当前事务在访问 它自己修改过的记录,所以该版本可以被当前事务访问。
- 如果被访问版本的trx_id属性值小于ReadView中的活跃的事务中最小的事务 ID值,表明生成该版本的事务在当前事务生成ReadView前已经提交,所以该版本可以被当前事务访问。
- 如果被访问版本的trx_id属性值大于或等于ReadView中的 low_limit_id 值,也就是大于ReadView生成时系统最大的事务id值,说明生成该版本的事务在当前事务生成ReadView后才开启,所以该版本不可以被当前事务访问。
- 如果被访问版本的trx_id属性值在ReadView的 up_limit_id 和 low_limit_id 之间,那就需要判 断一下trx_id属性值是不是在 trx_ids 列表中。
- 如果在,说明创建ReadView时生成该版本的事务还是活跃的,事务还没有提交,该版本不可以被访问。
- 如果不在,说明创建ReadView时生成该版本的事务已经被提交,该版本可以被访问。
-
MVCC整体操作流程:
- 首先获取事务自己的版本号,也就是事务 ID;
- 然后获取 ReadView;
- 查询得到的数据,然后与 ReadView 中的事务版本号进行比较;
- 如果不符合 ReadView 规则,说明是历史数据了,就需要从 Undo Log 中获取历史快照;
- 最后返回符合规则的数据。
-
在隔离级别为读已提交(Read Committed)时,一个事务中的每一次 SELECT 查询都会重新获取一次 Read View。
-
当隔离级别为可重复读的时候,就避免了不可重复读,这是因为一个事务只在第一次 SELECT 的时候会 获取一次 Read View,而后面所有的 SELECT 都会复用这个 Read View,
- 因为只会读取一次Read View,多次读取结果也是一样的,因此没有出现幻读现象,所以说在 MySQL 的可重复读隔离级别下,不存在幻读问题。
-
这样做的好处是大多数查询都不在需要获取锁了,只需要确保查询符合条件的行即可,
-
缺点是每一行数据会有更多的列,检查行时也需要做额外工作
mvcc解决的问题
- 读写之间互不阻塞,提高并发能力
- 降低了死锁的概率,因为是采用乐观锁的方式,读数据不加锁
- 解决了快照读的问题,无论事务运行多长时间,看到的数据都是一致的,也意味着不同事务可以再同一时间看到同一张表中的不同数据