是什么
MVCC叫做多版本并发控制,实际上就是保存了数据在某个时间节点的快照。
原理
MVCC 用于读已提交和可重复读级别的控制,主要通过 undo log 日志版本链和 read view 来实现。
roll_pointer 指向更新事务之前生成的 undo log,undo log 用于事务的回滚,保证事务的原子性,trx_id 就是最近一次更新数据的事务ID。
当执行查询 sql 时会生成一致性视图 readview(这里生成不止时针对一张表的),它由执行查询时所有未提交事务 id 数组(数组有最小的 id 为min_id)和已创建的最大事务 id(max_id)组成,查询的数据结果需要跟 readview 做对比从而得到快照结果。
版本链对比规则:
- 如果落在 trx_id < min_id 的区间,表示这个版本是已提交的事务生成的,这个数据是可见的;
- 如果落在 trx_id > max_id 的区间,表示这个版本是由将来启动的事务生成的,肯定是不可见的;
- 如果落在 min_id <= trx_id <= max_id 的区间,那就包括两种情况:
a. 若 trx_id 在未提交的数组区间中,表示这个版本是由还没有提交的事务生成的,不可见,当前只有自己的事务见;
b. 若 trx_id 不在未提交的数组区间中,表示这个版本是已经提交了的事务生成的,所以可见;
对于删除的情况可以认为是 update 的特殊情况,会将版本链上最新的数据复制一份,然后将 trx_id 修改成删除操作的 trx_id ,同时在该条记录的头信息 record header 里的 delete flag 标记位上写为 true,来表示当前记录已经被删除,在查询时按照上面的规则查到对应的记录,如果 delete flag 标记为 true,意味着记录已经被删除,则不返回数据。