MySQL事务详解结合MVCC机制的理解

本文详细介绍了MySQL事务的四种隔离级别,重点解析了MVCC(多版本并发控制)机制,包括redo log和undo log的作用,以及如何解决脏读、不可重复读和幻读问题。还探讨了当前读和快照读的区别。
摘要由CSDN通过智能技术生成

MySQL事务的隔离级别

SQL标准定义了四个隔离级别:

  • READ-UNCOMMITTED(读取未提交):最低的事务隔离级别,允许读取尚未提交的数据变更,可能导致脏读,幻读,不可重复读。
  • READ-COMMITTED(读取已提交):可以阻止脏读,但是不可重复度,幻读仍然可能发生。
  • REPEATABLE-READ(可重复读):同一事务中,多次一样的查询结果相同,除非数据是被本身事务修改,可以阻止脏读和不可重复读,幻读仍然可能发生

脏读 ——读未提交(read-uncommited)

脏读,也叫读未提交。

首先,第一个连接开启事务,第二个连接也开启事务。第二个连接修改数据,但并未提交。与此同时,第一个连接读取修改后的数据。然而此时第二个事务又回滚。

所以,第一个连接所读取的东西就是就是一个脏数据(因为未的数据也会去读)。因为它和现在的mysql表里面的数据不符合,因为更新sql已经回滚了。

避免脏读 —— 读已提交(read committed)

首先,第一个连接开启事务,第二个连接也开启事务。第二个连接修改数据,但并未提交。与此同时,第一个连接读取,但它只会读已经提交的数据,所以不会读到修改后的数据。

此时,第二个连接提交事务。第一个连接再读,果然读到了更新后的数据。

不可重复读(reapeatable-read)

不可重复读的定义是,数据库访问中,一个事务范围内,两个或多个相同的查询,却返回了不同的结果。

上面的 避免脏读 —— 读已提交就会出现这样的情况

可重复读

如果将事务隔离级别设置为可重复读,那么即使第二个连接修改了数据且提交了事务。第一个连接在同一事务内,读取到的数据也是一样的。

幻读

举个例子,什么是幻读?

第一个连接开启事务,查询 条件为 x 的数据有一条。

此时,第二个连接也开启事务,并且插入一条 条件为 x 的数据。

如果第一个连接用快照读,查出来的数据和之前一样,是一条,但用当前读的时候,查到了两条数据,里面包括了第二个连接新增的。

这就是幻读现象。

怎么解决幻读? (serializable)

解决幻读的方式有很多,但是他们的核心思想是在操作某张表数据的时候,另一个数据不允许删除或者新增这张表的数据。

  1. 将事务的隔离级别调整为 SERIALIZABLE
  2. 在可重复读的事务级别下,给事务操作的这张表添加表锁
  3. 在可重复读的事务级别下,给事务操作的这行表添加Next-key Lock(Record Lock+Gap Lock)

深入理解MVCC机制

在mysql事务中,要么全部执行,要么全部回滚。事务的核心是基于两个文件 redo logundo log

redo log

redo log 叫重做日志,是记录物理数据变化的日志,使用DML对数据的修改操作都会产生redo log。它保证了数据的持久性

正因为redo log 记录了一系列的 DML操作,因此它也可进行数据恢复。redo log 一部分存在内存中,一部分存在磁盘文件中,和主流的日志框架一样,日志优先存入内存,再异步持久化到磁盘

undo log

uodo log 是回滚日志,两个作用:提供回滚操作多个行版本控制(MVCC:Muti-Version-Concurrency-Control)

uodo log 主要记录数据的逻辑变化,是逻辑日志。当delete 一条记录,undo log会记录一条对应的insert记录。当update一条记录,会记录一条相反的update log。因此,当rolloback的时候就可以直接读undo log 来回滚。

多行版本控制(MVCC)的时候,也是通过undo log 来实现的。

MVCC原理

版本链

MySQL每个行记录逻辑上是个链表,这个链表存在于undo log中。

  • trx_id,最近修改的事务的id。每次新增一个事务。该事务id会递增,因此trx_id可以表示事务开始的先后顺序
  • roll_pointer,指向上个版本的地址,可以通过它找到该记录修改前的信息。

总的来说,版本链的组成是 数据 + 正在修改它的事务id + 上个版本的地址(回滚需要)

每次更新后,都会将旧值放入undo log 中,本质就是记录一个旧的版本,更新次数多了,这个版本会因为 roll-ptr形成一个链表,我们称之为版本链。

ReadReview

MVCC仅仅在read-commited和repeatable-read两个隔离级别下工作。

区别在于两者生成readreview的策略不同。

对于read-committed(读已提交)和reapeatable-read两个隔离级别的事务来说,必须保证读到的是已经提交过的事务。

因此我们需要判断,版本链中的哪个版本对于当前事务来说是可见的。这就是readReview诞生的意义。

ReadReview 里有个id 列表 trx_ids,来存储的是当前活跃的读写事务,也就是还没有commit 和 rollback的事务。

举个例子:现在有一个版本链

idnametrx_idroll_ptr
1aa1null
idnametrx_idroll_ptr
1bb2上个版本的地址
idnametrx_idroll_ptr
1cc3上个版本的地址

接着,我们执行一个sql语句:

update user name = 'dd' where id = 1

但没有commit。此时readReview就会把这个事务放入 trx_ids中 【3】(trx_ids是为了记录未完成的事务)

由于3被放入了trx_ids中,因此该条记录不可见,继续查询吓一条,返回的结果是 "cc"

总结

所谓的MVCC(Muti-Version Concurrency Control,多版本并发控制)指的是 在read-commited和repeatable-read两个事务隔离级别的事务,在执行普通的SELECT操作的时候,访问的就是版本链的过程。

并且,read-committed和repeatable-read两个隔离级别很大的不同是:

read-commited 每次select 都会生成 一个readreview。

repeatable-read在select 前就生成好了一个ReadReview,之后每次查询都用这个readreview.

为什么repeatable-read能保证多次读取数据一致?

至于为什么repeatable-read能防止多次读结果不一致,是因为事务发生第一次读的时候,就会选定要读取的数据行版本,整个事务内,都读取这个选定好的版本行,不会因为另一个并发事务提交了新的版本行就去选择它。因此每次读取的数据都是一致滴。

同理,read-commited事务级别工作的事务就不能保证。是因为它会读取新的版本行数据,导致数据不一致

当前读和快照读的区别

1.快照读

普通读(也称快照读),就是单纯的SELECT语句。使用uodo log + MVCC 来实现的

除了这俩类

SELECT ... FOR UPDATE
SLECT ... LOCK IN SHARE MODE

普通读的执行方式是生成 readReview,会检查当前查的数据是否正在被修改(上面提到过,不做赘述),利用MVCC的机制来进行读取,并不会对记录加锁。

2.当前读

当前读,读取的是最新的版本。且需要获取对应记录的锁。

SELECT ... FOR UPDATE
SELECT ... LOCK IN SHARE MODE
UPDATE,DELETE,INSERT
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: MySQLMVCC(Multi-Version Concurrency Control)机制是通过为每个读操作创建一个版本(Version)并保留旧版本来实现的。这个机制允许多个事务同时访问同一数据行,同时确保它们不会互相干扰或产生冲突。 MVCC在MySQL中的实现方式是,对于每一行数据,在表中存储一个隐藏的系统版本号(system versioning),并将每个操作(包括SELECT查询)的时间戳与该行的版本号进行比较。当读取一行数据时,MySQL会根据当前的事务时间戳和行的版本号来决定该行是否可见。如果行的版本号早于当前事务的时间戳,则说明该行是旧版本,不可见;如果行的版本号晚于当前事务的时间戳,则说明该行是新版本,可见。 在MVCC机制下,读操作不会阻塞写操作,写操作也不会阻塞读操作。因此,MVCC机制可以提高并发性能和可伸缩性,使得多个事务可以同时访问同一数据库而不会产生锁定和阻塞问题。 但是,MVCC机制也有一些限制。例如,如果事务A在读取某个数据行的同时,事务B修改了该行的值,那么事务A在提交时就会检测到该数据行已经被修改,从而回滚该操作。此外,MVCC机制也会占用更多的存储空间来存储旧版本的数据行。 ### 回答2: MySQLMVCC(多版本并发控制)是一种用于处理并发访问的机制MVCC是通过在数据库的各种操作(如事务的开启、读取和写入)中使用隐藏的时间戳来实现的。 MVCC的主要目标是避免读取和写入操作之间的冲突,从而提高数据库的并发性能和资源利用率。它通过在内部为每个事务提供一个唯一的时间戳来实现。每个事务在开始时都会获得一个时间戳,并且事务中的每个操作都使用这个时间戳。 当一个事务读取数据时,它只能读取它开始时间之前的数据版本。这样可以避免读取到其他事务正在写入或修改的数据,从而保证读取操作的一致性和隔离性。 当一个事务写入数据时,它会创建一个新的数据版本,并将其与事务的时间戳关联。这个新版本的数据不会立即覆盖旧的数据,而是以一种类似于快照的方式存在。其他事务在读取数据时仍然可以访问旧版本的数据。 MVCC还使用了回滚段(undo log)来处理事务的回滚操作。当一个事务被回滚时,数据库会使用回滚段将所有该事务做出的修改逆转回去,从而恢复到事务开始之前的状态。 需要注意的是,MVCC机制对于并发性能和资源利用率的提升是有限的。在高并发的情况下,数据库可能会出现锁等待和资源竞争的问题。为了进一步优化并发性能,可以考虑使用其他技术,如乐观并发控制(Optimistic Concurrency Control)和分布式数据库。 ### 回答3: MySQLMVCC(Multi-Version Concurrency Control)机制是一种并发控制技术,用于处理数据库中的读写冲突。它允许多个事务同时读取数据库,同时也使得读写冲突被有效地解决。 MVCC机制基于以下两个重要的概念:版本号和快照。 首先,每个表中的每个行都有一个版本号。当一个事务对某行进行修改时,会为该事务创建一个新的版本,并将旧版本标记为过期。这样,读取该行的事务会读取到未过期的版本,而不会受到写用户的影响。同时,这也避免了仅读用户被阻塞的情况。 其次,为了实现读取未过期版本的行,MVCC机制通过创建快照来实现。快照是数据库在某个时间点的一个镜像,其中包含了未过期的行版本。当一个读取事务开始时,会生成一个当前的数据库快照,并基于这个快照来读取数据行。这样,读取事务不会看到在其开始时(即快照生成时)已提交的写入事务,从而实现了读写并发。 MVCC机制对于提高数据库的并发性能非常重要。它允许多个事务同时进行读操作,提高了数据库的并发处理能力。此外,它也避免了读写冲突和阻塞的情况,提高了数据库的效率和稳定性。 总之,MySQLMVCC机制通过使用版本号和快照来实现读写并发控制和冲突的解决。它是提高数据库并发性能和减少阻塞的关键技术之一,并且在实际的数据库应用中扮演着非常重要的角色。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值