面试题:讲一下MVCC机制?
我的回答:
MVCC,是多版本并发控制。
什么意思呢?
数据库会记录每条数据记录的变更情况,也就是说,一条数据记录是有多个版本的。
例如,一条数据,是:id=1,用户名为张三,密码为123456。经过多次update语句,密码被更改过多次,那么这个过程中,每一次的更改版本都会被数据库记录一下。
多个版本的数据就构成了一条版本链,通过回滚指针进行链接。
MVCC有三个关键词,分别是:隐藏字段、undo log和read view。
隐藏字段就是说一条数据记录,除了看到的字段比如说id、用户名、密码外,还有其他隐藏的字段,比如说:事务id,是用来标识每个事务的。
undo log是撤销日志,保证了事务的原子性,可以将事务回滚到事务开启之前的状态。
read view是做什么的呢?一条数据记录是有多个版本的,但是反馈给用户的,只能是一个版本。那么选择哪一个版本呢?这个就是read view来决定的。read view通过一套规则,比较当前事务id等来实现版本的选择。
MVCC解决了什么问题呢?
1.读写阻塞的问题。
当一条数据被加了独占写锁。那么之后的带有共享锁或排他锁的其他事务来进行读取数据的时候,就会被阻塞。因为是不兼容的。
MVCC的快照读进行查询时,就是直接返回read view选择的一个版本,不会存在读写阻塞的问题。
2.在RR(可重复读)隔离级别下,一定程度解决了幻读问题。
幻读问题就是在插入一条数据记录时,先查询了一下,发现数据库表中出现了这条记录(其实是被其他事务插入进来的)。
MVCC在RR(可重复读)隔离级别下,每次返回的都是同一个版本的数据,所以不会出现幻读的问题。
但是实质上,幻读问题是被间隙锁和临键锁解决的。