主要通过版本快照ReadView和版本链实现
当一个事务开启操作一条记录,会对该条记录生成对应快照。
事务id作为版本链中每个版本的唯一标识
版本链中按照事务开启顺序排列-分为三个区域
已提交事务->未提交事务->未开始事务
MVCC是什么?
Multi-Version Concurrency Control ,即多版本并发控制;
通过记录多个修改的历史版本替代锁,实现事务间的隔离效果,保证非阻塞读,提高性能,而不是一味地锁记录。
锁可以解决不可重复度问题,但依旧会阻塞,性能不是最佳。
MVCC实现核心
表的隐藏列:记录事务id以及上个版本数据地址;
undolog:记录数据各版本修改历史即事务链;
ReadView:读视图,用于判断哪些版本可见;
TRX_ID | 事务ID,每处理一次,则加1 |
ROLL_PTR | 指向undolog中的一个指针 |
ROW_ID | 用于索引 |
ReadView
什么是Read View?
说白了Read View就是事务进行快照读操作的时候生产的读视图(Read View),在该事务执行的快照读的那一刻,会生成数据库系统当前的一个快照,记录并维护系统当前活跃事务的ID(当每个事务开启时,都会被分配一个ID, 这个ID是递增的,所以最新的事务,ID值越大)
作用:
可以判断一下版本链中的哪个版本是当前事务可见的。那他是如何判断的呢?下面详细介绍。
其最重要的四个部分:
1、m_ids:表示在生成ReadView时当前系统中活跃的读写事务的事务id列表。
2、min_trx_id:表示在生成ReadView时当前系统中活跃的读写事务中最小的事务id,也就是m_ids中的最小值。
3、max_trx_id:表示生成ReadView时系统中应该分配给下一个事务的id值。
4、creator_trx_id:表示生成该ReadView的事务的事务id。
用ReadView判断哪个版本的数据可读的过程:
如果被访问版本的trx_id属性值与ReadView中的creator_trx_id值相同,意味着当前事务在访问它自己修改过的记录,所以该版本可以被当前事务访问。
如果被访问版本的trx_id属性值小于ReadView中的min_trx_id值,表明生成该版本的事务在当前事务生成ReadView前已经提交,所以该版本可以被当前事务访问。
如果被访问版本的trx_id属性值大于或等于ReadView中的max_trx_id值,表明生成该版本的事务在当前事务生成ReadView后才开启,所以该版本不可以被当前事务访问。
如果被访问版本的trx_id属性值在ReadView的min_trx_id和max_trx_id之间,那就需要判断一下trx_id属性值是不是在m_ids列表中,如果在,说明创建ReadView时生成该版本的事务还是活跃的,该版本不可以被访问;如果不在,说明创建ReadView时生成该版本的
分析理解
事务A->B->C->D
ABC处于undo log中
ReadView读视图,用于判断哪些版本可见;
低版本已提交事务<(未提交事务ID数组)<高版本
不在未提交的事务数组中并且,事务ID小于最大事务ID或者事务ID为自己,对于当前事务都可见。
有事务要执行查询操作:
首先读视图 为 105 | [105,108,200] | 200
且当前事务为 120
下图中只有事务为 100 事务的对 120 事务可见
我们查询用户名Select name 得出结果 张三
假设现在 108 事务提交了事务,
当前事务再次查询用户名Select name
我们当前事务可选择是否重取ReadView
重取则 ReadView 更新为 105 | [105,200] | 200 ,得出结果 王二
不重取则 ReadView 仍为 105 | [105,108,200] | 200 ,得出结果 张三