目录
前言
先上结论:MySQL在“可重复读”级别下无法彻底避免“幻读”问题。
innoDB是MySQL的默认存储引擎,相对于MyISAM,其具有的优点之一就是支持事务管理和行级锁定,并且有多个隔离级别可以选用,根据需求选择合适的隔离级别可以更好地控制并发访问和保证数据的一致性。
一、什么是幻读
研究innoDB是否能解决幻读问题,首先我们要先知道,什么是幻读?当同一个查询在不同的时间产生不同的结果集时,事务中就会出现所谓的幻读问题
例如事务T1读取某个范围内的数据,事务T2在这个范围内新插入一条数据,那么这个时候T1再次对该范围进行读取,得到的结果不一致,这就是幻读。
例如:(假设的情况)
二、在可重复读级别下MVCC是如何幻读问题的
MVCC,全称Multi-Version Concurrency Control,即多版本并发控制。 在数据库管理系统中,实现对数据库的并发访问。
先介绍几个概念:
- 快照读:在读取数据时,读取的是一个静态版本(快照)而不是实时的版本。在快照读期间,即使其他事务修改了数据,快照读也不会受到影响。
- 当前读:读取数据时,读取的是最新的数据版本,而不是一个静态版本。当前读会获取锁来确保读取的数据是最新的,并且在读取期间阻塞其他事务对该数据的修改。
在MySQL中,除了普通查询属于快照读,其它(比如update、insert、delete)都属于当前读。另外,“select ... for update”
这种查询语句也是当前读,每次执行的时候都是读取最新的数据。
1、innoDB解决普通查询的幻读问题
innoDB就是根据不同的快照策略+undolog实现不同的隔离级别的。简单来说,就是当一个事务第一次对数据库就是查询时,会创建一个Read View,在同个事务中,后续的查询语句都会利用这个Read View在undo log版本链中找到开始时的数据,这样同个事务中多次查询读取到的数据结果就是一样的了。(详细请看MVCC实现原理)
即:
2、innoDB当前读如何解决幻读问题
上面说到:“
select ... for update”
这种查询语句也是当前读
先引入以下概念:
- 间隙锁:间隙锁是指锁定一个数据范围,但是不包括这个范围内的任何数据。间隙锁的目的是为了防止其他事务在这个范围内插入新的数据,从而保证事务的隔离性。
- 记录锁:记录锁是指锁定数据库中的一条记录,以防止其他事务对这条记录进行修改或删除。在关系型数据库中,记录锁通常可以分为排他锁和共享锁两种类型。
当使用当前读查询数据时,会获取共享锁或排他锁,以防止其他事务修改或删除该行数据。
比如执行“select name from user where id > 1 for update”这条语句时,就在对表中的记录加上 id 范围为 (1, +∞] 的 next-key lock(next-key lock 是间隙锁+记录锁的组合)。
为更直观地感受间隙锁带来的作用,下面举一个对比例子
- 假如当前读不加锁
- 正常情况下(即加锁)
三、可重复读级别下的幻读问题
综上所述,其实可重复读级别下已经基本解决了幻读问题,所以什么情况下会出现幻读呢?
1、同一事务第二次查询前对数据进行了更新操作
假设数据库user表中不存在id=5这条数据。
解释:
第一次查询时,因为user表中没有id=5这条数据,所以不返回任何数据。但是这时事务T2插入了一条id为5的数据并提交,然后T1又刚刚好对这条数据进行了更新(即当前读操作),因为是对自己事务的更新操作,所以对于第二次查询是可见的,因此得到的结果是“不是太白”。
该场景比较挑剔,实际应用中基本不会遇到该情况,但它确实是存在的。
2、同一事务第一次使用快照读第二次使用当前读
场景如下:
解释:
由于事务T1第一条select使用的是快照读,所以并没有创建间隙锁.此时T2插入一条新数据并提交后,T1又使用for update当前读,就会得到3条数据,即幻读。
四、如何避免幻读
根据上面两个案例,我们可以得出:
①尽量避免对空数据进行更新;
②在开启事务后马上执行select ... for update 当前读操作,这样它就会对记录加上next-key lock,避免其它事务对范围内数据的修改。
五、总结
由上可得,MySQL的“可重复读”级别并没有彻底避免幻读问题,在个别极端情况下仍会出现幻读。了解了可能出现幻读的场景,在实际应用中才能更好的规避该问题。同时,在不同需求下选择不同的事务隔离级别可以更好地发挥性能和节省资源。