多版本是什么?一行数据的版本链,通过不同版本id获取不同数据。
并发是什么?并发修改。控制是什么?是指控制读取的结果。这是 MVCC的含义
MVCC在MySQL InnoDB中的实现主要是为了提高数据库并发性能
用更好的方式去处理读-写冲突,做到即使有读写冲突时,也能做到不加锁,非阻塞并发读。
什么是当前读和快照读?
在学习MVCC多版本并发控制之前,我们必须先了解一下,什么是MySQL InnoDB下的当前读和快照读?
-
当前读
像select lock in share mode(共享锁), select for update ; update, insert ,delete(排他锁)这些操作都是一种当前读,它读取记录最新版本,读取时还要保证其他并发事务不能修改当前记录,会对读取的记录进行加锁。
-
快照读
不加锁的非阻塞读,不加锁的select操作就是快照读;快照读的前提是隔离级别不是串行级别,串行级别下的快照读会退化成当前读;之所以出现快照读的情况,是基于提高并发性能的考虑,快照读的实现是基于行锁的一个变种,但它在很多情况下,避免了加锁操作,降低了开销;既然是基于多版本,有可能是之前的历史版本。
说白了MVCC就是为了实现读-写冲突不加锁,而这个读指的就是快照读,当前读实际上是一种加锁的操作,是悲观锁的实现
两读和MVCC的关系
当前读,快照读和MVCC之间是什么关系呢?
-
MVCC指的是维持多版本,读写没冲突。仅仅是一个理想概念
-
而在MySQL中实现MVCC理想概念,而快照读就是MySQL为我们实现理想模型的一个具体非阻塞读功能。
-
MVCC模型在MySQL中的具体实现则是由 4个隐式字段,undo日志 ,Read View 等去完成的
MVCC能解决问题,好处是?
提高并发性能,读写冲突不加锁,非阻塞,为事务分配单向增长的时间戳
数据库并发场景?
有三种, 分别为:
-
读-读:不存在任何问题,也不需要并发控制
-
读-写:有线程安全问题,可能会造成事务隔离性问题,可能遇到脏读,幻读,不可重复读
-
写-写:有线程安全问题,可能会存在更新丢失问题,比如第一类更新丢失,第二类更新丢失
MVCC工作过程
在每行纪录后面保存两个隐藏的列来实现的。这两个列,一个保存了行的创建版本号,一个保存了行的删除版本号。每开始一个新的事务,系统版本号都会自动递增。
在REPEATABLE READ隔离级别下,MVCC具体的操作如下:
undo log 在不考虑redo log 的情况下利用undo log工作的简化过程为:
1)为了保证数据的持久性数据要在事务提交之前持久化 2)undo log的持久化必须在在数据持久化之前,这样才能保证系统崩溃时,可以用undo log来回滚事务
Innodb中的隐藏列
Innodb通过undo log保存了已更改行的旧版本的信息的快照。 InnoDB的内部实现中为每一行数据增加了三个隐藏列用于实现MVCC。、
*SELECT*
InnoDB会根据以下两个条件检查每行纪录:
-
InnoDB只查找版本早于当前事务版本的数据行,即,行的系统版本号小于或等于事务的系统版本号,这样可以确保事务读取的行,要么是在事务开始前已经存在的,要么是事务自身插入或者修改过的。
-
行的删除版本,要么未定义,要么大于当前事务版本号。这样可以确保事务读取到的行,在事务开始之前未被删除。
只有符合上述两个条件的纪录,才能作为查询结果返回。
*INSERT*
InnoDB为插入的每一行保存当前系统版本号作为行版本号。
*DELETE*
InnoDB为删除的每一行保存当前系统版本号作为行删除标识。
*UPDATE*
InnoDB为插入一行新纪录,保存当前系统版本号作为行版本号,同时作为行删除标识。
MVCC优缺点
MVCC带来的好处是?
用来解决读-写冲突的无锁并发控制,也就是为事务分配单向增长的时间戳,为每个修改保存一个版本,版本与事务时间戳关联,读操作只读该事务开始前的数据库的快照。
所以MVCC可以为数据库解决以下问题:
在并发读写数据库时,可以做到在读操作时不用阻塞写操作,写操作也不用阻塞读操作,提高了数据库并发读写的性能,同时还可以解决脏读,幻读,不可重复读等事务隔离问题,但不能解决更新丢失问题
MVCC在大多数情况下代替了行锁,实现了对读的非阻塞,读不加锁,读写不冲突。
缺点是每行记录都需要额外的存储空间,更多的行维护和检查工作。
补充:
1.MVCC手段只适用于Msyql隔离级别中的读已提交(Read committed)和可重复读(Repeatable Read)。
2.Read uncommitted由于存在脏读,即能读到未提交事务的数据行,所以不适用MVCC.
原因是MVCC的创建版本和删除版本只要在事务提交后才会产生。
3.串行化由于是会对所涉及到的表加锁,并非行锁,自然也就不存在行的版本控制问题。
4.通过以上总结,可知,MVCC主要作用于事务性的,有行锁控制的数据库模型。