MySQL事务与MVCC详解

前置概念之事务

在开始MVCC的讨论之前,我们必须了解一些关于事务的概念。

什么是事务

现在我们开发的一个功能需要进行操作多张表,假如我们遇到以下几种情况:

  1. 某个逻辑报错
  2. 数据库连接中断
  3. 某台服务器突然宕机

这时候我们数据库执行的操作可能才到一半,所以为了避免这种一半一半的情况,我们就需要事务来保证数据一致性。
所以事务就是当作一个原子的逻辑组操作,要么全都成功执行,要么全部都失败。事务有分分布式事务和数据库事务,如果没有特指,我们平时所说的事务都是数据库事务,也就是本文探讨的话题。

事务的四大特性

  1. 原子性(Atomicity):一组操作要构成一个原子,原子可以看作事务的最小单位,不可在进行分割了,要么都执行,要么都不执行。
  2. 一致性(Consistency):经过一个事务的操作后,前后要保持数据一致性,例如我们要用数据库记录一次转账操作,那么两个数据经过转账逻辑之后总额还是保持不变。
  3. 隔离性(Isolation):在并发场景下,每个事务之间的操作互不干扰。
  4. 持久性(Durability):存储到数据库中的数据永不丢失,及时数据库发生故障,当然机器被破坏了那就另说了。

并发事务会带来那些问题

这里笔者先说一个概念,具体会在后文示例中详尽介绍

脏读

我们举个例子,我们开启一个事务A,准备读取user表的数据,结果事务B将事务A要读取的数据修改了,但事务还没提交,A却能看到这个未提交的结果(而且这个结果后续还不一定提交)
这种其他事务还没提交的结果能被另一个事务看到的情况就属于脏读

幻读

我们再举个例子,事务A查询user表,此时表中有10条数据。再次期间,事务B插入5条数据。事务A在查发现有15条事务。这就是幻读。

不可重复读

仍然举一个例子,事务A读取id为1的数据,namexiaoming。事务B在此期间更新id为1的数据并提交这个事务,结果事务A再次读取时发现name变了,这就是不可重复读。

你可能会问了,这和幻读听起来是一个概念啊,他俩有什么区别?
幻读说白了就是针对插入或者删除操作后导致数据前后不一致的情况,而不可重复读是针对两次相同查询操作出现数据不一致。

数据丢失

这个就很好理解了,高并发场景下,事务A修改id为1的money+100,事务B修改id为1的money+200,他们统一时间读取,先后写入,这就导致如果事务A后写入,那么money最后只加了100,如果事务B后写入,那么money就少了100

事务的隔离级别

读未提交(READ UNCOMMITTED)

在这个级别下,任何事务的修改操作即使没有提交,其他事务也能看到,造成脏读。

在这里插入图片描述

对此我们不妨用下面这段SQL来验证一下:

首先我们先建个测试表

create table test2 (id int,name varchar(10),money int); 
insert into test2 values(1,'xiaoming',100);
insert into test2 values(2,'xiaowang',100);

事务A开启事务,进行更新操作,不提交

start transaction;
update test2   set money = money +100 where name ='xiaoming';
update test2   set money =money -100 where name ='xiaowang';

事务B设置为读未提交的隔离级别

SET SESSION TRANSACTION ISOLATION LEVEL READ committed;
select * from test2 t ;

查询结果是事务B看到了事务A的更新操作,造成脏读。同理这个隔离级别也会造成幻读(同一个事务同一次查询记录数不一样)、以及不可重复读(同一个事务下查询记录的值不一样)

读已提交(READ COMMITTED)

这个概念也很好理解,每个事务只能看到其他事务提交后的数据。避免了脏读:

在这里插入图片描述

但是无法避免幻读和不可重复度,我们就以幻读为例,如下图,事务B首先查询到数据表中没有id为1的用户,在这个查询结束后,事务A进行一次插入操作但是事务还未提交。

在这里插入图片描述

此时,在事务A执行插入但还未提交事务前,事务B进行插入操作。结果插入失败了,事务B就感觉出现幻觉一样,明明没查到数据,咋还告诉我违反唯一约束了呢?

在这里插入图片描述

了解流程之后,我们拿SQL印证一下,首先创建数据表

drop table if exists account1;


CREATE TABLE `account1` (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `name` varchar(50) DEFAULT NULL,
  `balance` int(11) DEFAULT NULL,
  PRIMARY KEY (`id`),
  UNIQUE KEY `account1_un` (`name`)
) ENGINE=InnoDB AUTO_INCREMENT=3 DEFAULT CHARSET=UTF8MB4;

事务B查询,没数据

SET SESSION TRANSACTION ISOLATION LEVEL READ committed;
START TRANSACTION;
SELECT * from account1;

事务A在此期间插入,事务不提交

SET SESSION TRANSACTION ISOLATION LEVEL READ committed;
START TRANSACTION;
insert into account1(name,balance) values('zhangsan',1000);

事务B插入失败,造成幻读。

insert into account1(name,balance) values('zhangsan',1000);

可重复读(REPEATABLE READ)

这个隔离级别,也很好理解,同一个事务内,多次查询的数据都是一样的。我们不妨基于上面的例子实验一下

首先事务B查询

SET SESSION TRANSACTION ISOLATION LEVEL  REPEATABLE READ;
START TRANSACTION;
select * from account1 a  where id=3;

事务A执行更新并提交

SET SESSION TRANSACTION ISOLATION LEVEL  REPEATABLE READ;
START TRANSACTION;
update account1 set balance=0 where id=3;
commit;

事务B再查数据还是不变,总的来说可重复读避免了脏读和不可重复读,但是幻读还是无法避免。

串行化(SERIALIZABLE)

事务隔离最高级别,解决上方一切问题。

MVCC

了解当前读和快照读

快照读,即读取数据是从快照中获取的,事务在进行事务读取时不上锁,这就是mysql并发读写性能高的原因之一。而当前读反之,读取数据时会上锁,这也就意味着即使你的隔离级别是可重复读,你用当前读也能读取到其他事务的最新结果,造成不可重复读。

如下所示:

首先事务A读取数据,假设数据值是100


begin;
select * from account1 a ;

事务B更新事务并提交

update account1 set name='xiaozhang1' where id=1;

事务A使用快照读,数据还是1000

select * from account1 a ; --快照读 旧数据

一旦使用当前读,就是其他事务提交的新数据了

--两个都是当前读,得到最新结果
select * from account1 a for update; 
select * from account1 a lock in share mode;4

核心概念之undo log

首先说说undo log,在innoDB的聚簇索引中,每一条记录除了我们表中的数据以外,还会额外记录名为事务id(transaction id)的隐藏列。每当用户对当前数据进行修改操作后,新值的数据的事务id就会递增。同时每行数据还有一个回滚指针(roll_pointer),如下图所示,每当用户对索引进行更新之后,旧的数据就会被存放到undo log中,新的数据的回滚指针指向这条最新的旧数据(就是刚刚存到undo log中的数据,通俗的说是最新的垃圾)。用于后续可能需要的回滚操作。

在这里插入图片描述

核心概念之readView

说完了undo log,接下来就说说readViewreadView就是真正用到undo log的东西,readView如下图所示,可以看到它由三个部分组成,分别是:

  1. 已提交事务:已提交事务中记录的则是已经被提交的事务id集合。
  2. 活跃事务:这个则记录那些还能活动且还没被提交的事务,其中min_trx_id指向活跃事务的最小值。
  3. 未开始事务:这里面则是存放待使用的事务id值,其中max_trx_id就是记录这一块的最小值。

在这里插入图片描述

用几个事务间的SQL的MVCC工作机制

了解了undo logreadView,我们就可以了解mvcc的工作机制了。就以可重复读为例,我们来了解一下这两个东西如何实现可重复读。

首先事务A进行查询,查询语句为:

select * from account1 a where id=1;

然后事务启动创建readView,如下图所示,可以看到从数据表中知道id为1当前名字为xiaoming

在这里插入图片描述

翻译成readView如下图所示,注意当前事务是读操作,所以事务id为0,从下图可以看出已提交事务中的最大值为50,所以就取50,所以namexiaoming

在这里插入图片描述

这时候,事务B启动,对id为1的数据进行更新,SQL如下所示,事务提交。

update account1 set name='aa' where id=1;

完成后,undo log图如下所示

在这里插入图片描述

回到事务A,由于可重复这个隔离级别只有在启动时创建readView,所以在此查询id为1的值,所以readView还是和第一次查询一样,取值还是取已提交事务最大值,所以name还是xiaoming

在这里插入图片描述

了解了可重复读的过程吗,我们再来说说读已提交这个隔离级别下的工作过程,老规矩事务A进行查询,得到namexiaoming

undo log如下图所示

在这里插入图片描述

生成的readView如下所示,所以事务id取50,name为xiaoming。

在这里插入图片描述

此时事务B进行更新操作,并将事务提交,最终undo log如下

在这里插入图片描述

回到事务A,由于当前隔离级别是读已提交,所以每次查询都会生成最新的readView,由于事务B提交了最新结果,所以取最新已提交事务id 60,得到name为aa的数据。

在这里插入图片描述

更进一步的理解

MySQL 的隔离级别是基于锁实现的吗

答: 是基于锁和mvcc共同实现的,SERIALIZABLE 这个隔离级别就是基于锁实现的,其他隔离级别都是基于mvcc,需要补充的是REPEATABLE-READ 如果使用当前读也是基于锁实现。

MySQL 的默认隔离级别是什么?

以笔者使用的MySQL8来说使用如下命令可以看到默认级别为可重复读

select @@transaction_isolation;

参考文献

看完这篇还不懂MySQL的MVCC机制算我输

MVCC 水略深,但是弄懂了真的好爽!

MySQL常见面试题总结

  • 2
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
### 回答1: MySQLMVCC(Multi-Version Concurrency Control)机制是通过为每个读操作创建一个版本(Version)并保留旧版本来实现的。这个机制允许多个事务同时访问同一数据行,同时确保它们不会互相干扰或产生冲突。 MVCC在MySQL中的实现方式是,对于每一行数据,在表中存储一个隐藏的系统版本号(system versioning),并将每个操作(包括SELECT查询)的时间戳与该行的版本号进行比较。当读取一行数据时,MySQL会根据当前的事务时间戳和行的版本号来决定该行是否可见。如果行的版本号早于当前事务的时间戳,则说明该行是旧版本,不可见;如果行的版本号晚于当前事务的时间戳,则说明该行是新版本,可见。 在MVCC机制下,读操作不会阻塞写操作,写操作也不会阻塞读操作。因此,MVCC机制可以提高并发性能和可伸缩性,使得多个事务可以同时访问同一数据库而不会产生锁定和阻塞问题。 但是,MVCC机制也有一些限制。例如,如果事务A在读取某个数据行的同时,事务B修改了该行的值,那么事务A在提交时就会检测到该数据行已经被修改,从而回滚该操作。此外,MVCC机制也会占用更多的存储空间来存储旧版本的数据行。 ### 回答2: MySQLMVCC(多版本并发控制)是一种用于处理并发访问的机制。MVCC是通过在数据库的各种操作(如事务的开启、读取和写入)中使用隐藏的时间戳来实现的。 MVCC的主要目标是避免读取和写入操作之间的冲突,从而提高数据库的并发性能和资源利用率。它通过在内部为每个事务提供一个唯一的时间戳来实现。每个事务在开始时都会获得一个时间戳,并且事务中的每个操作都使用这个时间戳。 当一个事务读取数据时,它只能读取它开始时间之前的数据版本。这样可以避免读取到其他事务正在写入或修改数据,从而保证读取操作的一致性和隔离性。 当一个事务写入数据时,它会创建一个新的数据版本,并将其与事务的时间戳关联。这个新版本的数据不会立即覆盖旧的数据,而是以一种类似于快照的方式存在。其他事务在读取数据时仍然可以访问旧版本的数据MVCC还使用了回滚段(undo log)来处理事务的回滚操作。当一个事务被回滚时,数据库会使用回滚段将所有该事务做出的修改逆转回去,从而恢复到事务开始之前的状态。 需要注意的是,MVCC机制对于并发性能和资源利用率的提升是有限的。在高并发的情况下,数据库可能会出现锁等待和资源竞争的问题。为了进一步优化并发性能,可以考虑使用其他技术,如乐观并发控制(Optimistic Concurrency Control)和分布式数据库。 ### 回答3: MySQLMVCC(Multi-Version Concurrency Control)机制是一种并发控制技术,用于处理数据库中的读写冲突。它允许多个事务同时读取数据库,同时也使得读写冲突被有效地解决。 MVCC机制基于以下两个重要的概念:版本号和快照。 首先,每个表中的每个行都有一个版本号。当一个事务对某行进行修改时,会为该事务创建一个新的版本,并将旧版本标记为过期。这样,读取该行的事务会读取到未过期的版本,而不会受到写用户的影响。同时,这也避免了仅读用户被阻塞的情况。 其次,为了实现读取未过期版本的行,MVCC机制通过创建快照来实现。快照是数据库在某个时间点的一个镜像,其中包含了未过期的行版本。当一个读取事务开始时,会生成一个当前的数据库快照,并基于这个快照来读取数据行。这样,读取事务不会看到在其开始时(即快照生成时)已提交的写入事务,从而实现了读写并发。 MVCC机制对于提高数据库的并发性能非常重要。它允许多个事务同时进行读操作,提高了数据库的并发处理能力。此外,它也避免了读写冲突和阻塞的情况,提高了数据库的效率和稳定性。 总之,MySQLMVCC机制通过使用版本号和快照来实现读写并发控制和冲突的解决。它是提高数据库并发性能和减少阻塞的关键技术之一,并且在实际的数据库应用中扮演着非常重要的角色。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

shark-chili

您的鼓励将是我创作的动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值