mysql什么场景下要防止幻读,MySQL 什么是幻读?如何解决?

何为幻读?

先看看MySQL官方的介绍:

The so-called phantom problem occurs within a transaction when the same query produces different sets of rows at different times. For example, if a SELECT is executed twice, but returns a row the second time that was not returned the first time, the row is a “phantom” row.

后面还有一部分内容,推荐阅读。

幻读,即 同一个事务 中 不同时间的两次相同查询 返回 不同行数的结果。

本文还有一个前提,事务的隔离级别为 可重复读 (RR)。

我们来仔细分析一下这个定义,首先是“同一个事务”,这个是前提,没有疑问。之后是“不同时间的两次相同查询”,“不同时间”也是前提,但是由于没有更多的限制,也就是说两次查询之间任何的增删操作都是允许的,但是有个问题,“两次相同查询”该如何理解?

假设有如下场景:

Time

Session A

Session B

T0

mysql> begin;

Query OK, 0 rows affected (0.00 sec)

T1

mysql> select * from t;

Empty set (0.00 sec)

T2

mysql> insert into t values(1);

Query OK, 1 row affected (0.01 sec)

T3

mysql> select * from t;

Empty set (0.00 sec)

T4

mysql> select * from t for update;

mysql> select * from t for update;

+------+

| id |

+------+

| 1 |

+------+

1 row in set (0.00 sec)

从表格中可以看出,Session A 在 T3 时刻的查询结果和 T1 时刻的一致,这是因为有 InnoDB MVCC的支持,而在 T4 时刻通过“当前读”查询到 Session B 插入的数据。

如果我们将 select ... 和 select ... for update 视为相同的查询,那么上面就是幻读的一种情况,但是个人还是偏向于认为这两条语句是不同的,原因有两点,一是语句本身确实不一样;二是功能上就存在很大差异,前者是“快照读”,而后者是“当前读”。

由于我们将这两条语句视为不同的查询语句,那上面的情况就不算是幻读,那怎样的情况算是呢?

假设有如下结构的表和数据:

CREATE TABLE `t` (

`id` int(11) NOT NULL,

`c` int(11) DEFAULT NULL,

`d` int(11) DEFAULT NULL,

PRIMARY KEY (`id`),

KEY `c` (`c`)

) ENGINE=InnoDB;

insert into t values(0,0,0),(5,5,5);

并且执行流程如下:

Time

Session A

Session B

T0

mysql> begin;

Query OK, 0 rows affected (0.00 sec)

T1

mysql> select * from t where d=5;

mysql> select * from t where d=5;

+----+------+------+

| id | c | d |

+----+------+------+

| 5 | 5 | 5 |

+----+------+------+

1 rows in set (0.00 sec)

Time

Session A

Session B

T2

mysql> insert into t values(10, 10, 5);

Query OK, 1 row affected (0.01 sec)

T3

mysql> update t set d=5 where id=0;

Query OK, 1 row affected (0.00 sec)

Rows matched: 1 Changed: 1 Warnings: 0

T4

mysql> select * from t;

mysql> select * from t;

+----+------+------+

| id | c | d |

+----+------+------+

| 0 | 0 | 5 |

| 5 | 5 | 5 |

| 10 | 10 | 5 |

+----+------+------+

3 rows in set (0.01 sec)

Time

Session A

Session B

T5

mysql> select * from t where d=5;

mysql> select * from t where d=5;

+----+------+------+

| id | c | d |

+----+------+------+

| 5 | 5 | 5 |

+----+------+------+

1 rows in set (0.00 sec)

Time

Session A

Session B

T6

mysql> update t set c=15 where d=5;

Query OK, 3 rows affected (0.00 sec)

Rows matched: 3 Changed: 3 Warnings: 0

T7

mysql> select * from t where d=5;

mysql> select * from t where d=5;

+----+------+------+

| id | c | d |

+----+------+------+

| 0 | 15 | 5 |

| 5 | 15 | 5 |

| 10 | 15 | 5 |

+----+------+------+

3 rows in set (0.01 sec)

可以看到 Session B 在 T2 和 T3 时刻分别导入和更新了一笔记录,由于 MVCC 机制,结果对 Session A 不可见(T5),但是当 Session A 在 T6 时刻更新 d=5 的记录时,却同时更新了 3 笔记录,这是因为所有的 update 语句都是“当前读”,使得 Session A 在更新时可以看到 Session B 提交的记录。

接下来奇怪的事情发生了,Session A 再次执行相同的查询时,却返回了三条记录。其实也不奇怪,还是由于 MVCC 机制,在事务中是能够看到自己更新过的记录的。

幻读出现了!!!

这里补充一点,一般都说幻读都是由于新增记录导致的,但是从上面的流程可以看到,Session B 在 T3 时刻更新数据也同样导致 Session A 出现“幻觉”,看到了这条本不应该看到的记录。

如何解决幻读问题?

解决方式有两种:

1.一种就是提高数据库的隔离级别为“串行化”,那么当 Session A 开启事务后,Session B 执行的任何写操作都会被阻塞,直到 Session A 完成事务的提交,如此,Session A 在执行期间只有自己会更新数据(当前读),而且更新的数据又对自己可见(相当于当前读),也就没有了幻读。

方法简单,但是将所有的写事务都串行化,对性能的影响是巨大的,不推荐。

2.另一种是使用 select ... for update 代替 select ...,首先前者是“当前读”,会读取到记录的最新状态,然后还会对记录以及记录间的间隙进行加锁,也就是行锁和间隙锁,合起来又称为 next-key 锁,行锁仅仅会锁索引,next-key 锁则还包括索引之前的间隙。

MySQL 是一边遍历索引一边添加锁的,对于上面 t 表中的 d 字段,该字段没有建立索引,所以走的全表的查询,也就是全表的所有记录和其之前的间隙都被加锁了,此时任何的其它事务都无法进行写操作,也就不会出现上面幻读的情况。

但是如果查询的是拥有索引的 c 字段,则只会对 (0,5] 和 (5, +supremum] 区间进行加锁,InnoDB 给每个索引加了一个不存在的最大值 supremum,以满足前开后闭区间。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Hmily是柔性分布式事务解决方案,提供了TCC 与 TAC 模式。它以零侵入以及快速集成方式能够方便的被业务进行整合。在性能上,日志存储异步(可选)以及使用异步执行的方式,不损耗业务方法方法。之前是由我个人开发,目前由我在京东数科已经重新启动,未来将会是金融场景的分布式事务解决方案。 功能: 高可靠性:支持分布式场景下,事务异常回滚,超时异常恢复,防止事务悬挂 易用性:提供零侵入性式的 Spring-Boot,Spring-Namespace 快速与业务系统集成 高性能:去中心化设计,与业务系统完全融合,天然支持集群部署 可观测性:Metrics多项指标性能监控,以及admin管理后台UI展示 多种RPC:支持 Dubbo,SpringCloud,Motan,Sofa-rpc,brpc,tars 等知名RPC框架 日志存储:支持 mysql,oracle,mongodb,redis,zookeeper 等方式 复杂场景:支持RPC嵌套调用事务 必要前提: 必须使用 JDK8+ TCC模式必须要使用一款 RPC 框架,比如:Dubbo,SpringCloud,Montan TCC模式 当使用TCC模式的时候,用户根据自身业务需求提供 try,confirm,cancel 等三个方法, 并且 confirm,cancel 方法由自身完成实现,框架只是负责来调用,来达到事务的一致性。 TAC模式 当用户使用TAC模式的时候,用户必须使用关系型数据库来进行业务操作,框架会自动生成回滚SQL,当业务异常的时候,会执行回滚SQL来达到事务的一致性。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值