MySQL多版本控制解读
为什么会有多版本控制
- 多版本控制存在意义:
在我们的隔离级别中,MySQL的默认隔离级别为可重复读
它能够确保一个事务在多个实例的并发读取数据时,会看到同样的数据行,但是无法解决幻读(也就是在读取过程中,其它事务又进行了数据插入)
通过并发控制机制就能够解决除该幻读以外的问题。
多版本控制介绍
- MVCC(多版本控制)并不是MySQL独有的,Oracle等在使用
- MVCC并不是简单的使用行锁,而是使用”行级别锁“
- MVCC实现原理如下:
通过保存数据在某个时间点的快照来实现,一个事务无论运行多长的时间,在同一个事务里能够看到数据一致的视图。根据事务开始的时间不同,同时也就意味着在同一个时刻不同的事务看到的相同表里的数据可能时不同的。
- MVCC基本特征:
1:每行数据都存在一个版本,每次更新数据时都更新该版本
2:修改时Copy出当前版本随意修改,各个事务之间无干扰
3:保存时比较版本号,如果成功,则覆盖原纪录;失败则放弃
InnoDB存储引擎MVCC的实现策略
- 在每一行数据中额外存放两个隐藏的列:
当前行创建时的版本号和删除时的版本号(可能为空,其实还有一列成为回滚指针,用于事务回滚)。
这里的版本号并不是实际的时间值,而是系统版本号,系统版本号都会自动递增。
事务开始时刻的系统版本号会作为事务的版本号,用来和查询每行记录的版本号进行比较。
- 每个事务又有自己的版本号,这样事务内指向CRUD操作时,就通过版本号的对比来达到数据版本控制的目的。
实现的效果
- 上述已经讲过隐藏的两个列,分别为创建版本号和删除的版本号
- 加入事务为1,那么插入数据后的结构如下:
id | name | create_version | delete_version |
---|---|---|---|
1 | test | 1 |
- 在更新操作的时候,采用的是先标记旧的那行记录为已删除,并且删除的版本号就是事务的版本号,然后插入一行新的记录的方式
- 例如更新事务id为2的数据
id | name | create_version | delete_version |
---|---|---|---|
1 | test | 1 | 2 |
1 | new_value | 2 |
- 删除操作的时候,就把版本号作为删除版本号,比如:
- 删除id为1的数据
id | name | create_version | delete_version |
---|---|---|---|
1 | new_value | 2 | 3 |
- 在上面的操作可以看到,在查询时要符合以下两个条件的记录才能被事务查询出来
- 1: 删除版本号未指定或者大于当前事务版本号,即查询事务开启后确保读取的行未被删除。
- 2:创建版本号小于或者等于当前版本号,就是说记录创建是在当前事务中或者当前事务启动之前的其它事务进行的insert。