MySQL进阶 事务与锁

6.4.2 悲观锁
6.5 锁等待和死锁
6.6 如何避免死锁
6.7 MVCC,多版本并发控制
6.7.1 什么是当前读和快照读?
6.7.2 当前读,快照读和MVCC的关系
6.7.3 MVCC能解决什么问题
6.7.4 MVCC的实现原理
6.7.5 Read View(读视图)
6.7.6整体流程
6.7.7 MVCC相关问题
6.8 Redo log
6.8.1 Redo log工作原理
6.8.1.1 日志类型
6.8.1.2 checkpoint
6.8.1.3 LSN(Log Sequence Number)
6.8.1.4 工作原理
6.8.1.5 宕机恢复
6.8.2 redo log的结构
6.8.2.1 log block
6.8.2.2 log group
五、MySQL事务
5.1 事务简介
(1)在 MySQL 中只有使用了 Innodb 数据库引擎的数据库或表才支持事务。

(2)事务处理可以用来维护数据库的完整性,保证成批的 SQL 语句要么全部执行,要么全部不执行。

(3)事务用来管理 insert,update,delete 语句。

5.2 事务四大特征
一般来说,事务是必须满足4个条件(ACID):

5.2.1 原子性(Atomicity)
一个事务(transaction)中的所有操作,要么全部完成,要么全部不完成,不会结束在中间某个环节。事务在执行过程中发生错误,会被回滚(Rollback)到事务开始前的状态,就像这个事务从来没有执行过一样。

5.2.2 一致性(Consistency)
在事务开始之前和事务结束以后,数据库的完整性没有被破坏。这表示写入的资料必须完全符合所有的预设规则,这包含资料的精确度、串联性以及后续数据库可以自发性地完成预定的工作。(比如:A向B转账,不可能A扣了钱,B却没有收到)

5.2.3 隔离性(Isolation)
数据库允许多个并发事务同时对其数据进行读写和修改的能力,隔离性可以防止多个事务并发执行时由于交叉执行而导致数据的不一致。事务隔离分为不同级别,包括读未提交(Read uncommitted)、读提交(read committed)、可重复读(repeatable read)和串行化(Serializable)。(比u人:A正在从一张银行卡里面取钱,在A取钱的过程中,B不能向这张银行卡打钱)

5.2.4 持久性(Durability)
事务处理结束后,对数据的修改就是永久的,即便系统故障也不会丢失。

5.3 事务提交、回滚
– UNSIGNED代表无符号数,不能是负数
create table user(
id int primary key auto_increment,
name VARCHAR(20),
balance DECIMAL(10,2) UNSIGNED
);
insert into user VALUES (1,‘张三’,200);
insert into user VALUES (2,‘李四’,50000);
– 转账业务,必须都成功,或者都失败,所以不能一句一句执行,万一执行了一半,断电了咋办
– 所以要编程一个整体
– 都成功
– begin;
start transaction;
UPDATE user set balance = balance - 200 where id = 1;
UPDATE user set balance = balance + 200 where id = 2;
commit;
– 都失败
start transaction;
UPDATE user set balance = balance - 200 where id = 1;
UPDATE user set balance = balance + 200 where id = 2;
rollback;
5.3.1 实现的原理简单介绍
mysql每执行一条语句记录一条日志,

1、start transaction,先记个日志,真正执行执行。

2、UPDATE user set balance = balance - 200 where id = 1,先记个日志,真正执行。

? 2.1如果此时断电了,当然不能继续执行了,过了一会来电了,启动mysql会检查日志,发现有个事
务没有执行完毕,没有commit,就会安装反向的操作把他回滚了。

3、UPDATE user set balance = balance + 200 where id = 2,先记个日志,真正执行。

4、如commit,记个记录,执行,结束了,日志就能删除了。如果rollback,就会按照日志反向操作,
回滚。

5.4事务特性–隔离性
隔离强调的是两个或两个以上同时发生(并发)的业务同时操作一个数据库,为了让两个事务一方面能都看到、得到正确的结果,一方面还要保证一定的效率而产生的不同的隔离级别。

5.4.1 隔离性有隔离级别(4个)
(1)读未提交:read uncommitted

(2)读已提交:read committed

(3)可重复读:repeatable read

(4)串行化:serializable

查看个设置事务的隔离级别:

脏读 不可重复读 幻读
Read uncommitted √ √ √
Read committed × √ √
Repeatable read × × √
Serializable × × ×
查看设置事务的隔离级别:

SELECT @@global.tx_isolation, @@tx_isolation;
set session transaction isolation level repeatable read;
SET transaction isolation level read uncommitted;
SET transaction isolation level read committed;
set transaction isolation level repeatable read;
SET transaction isolation level serializable;
SET GLOBAL transaction isolation level read uncommitted;
SET GLOBAL transaction isolation level read committed;
set GLOBAL transaction isolation level repeatable read;
SET GLOBAL transaction isolation level serializable;
/其中,SESSION 和 GLOBAL 关键字用来指定修改的事务隔离级别的范围:
SESSION:表示修改的事务隔离级别将应用于当前 session(当前 cmd 窗口)内的所有事务;
GLOBAL:表示修改的事务隔离级别将应用于所有 session(全局)中的所有事务,且当前已经存在的
session 不受影响;
如果省略 SESSION 和 GLOBAL,表示修改的事务隔离级别将应用于当前 session 内的下一个还未开始的
事务。
/
5.4.2 读未提交
事物A和事物B,事物A未提交的数据,事物B可以读取到
这里读取到的数据叫做“脏数据”,叫脏读
这种隔离级别最低,这种级别一般是在理论上存在,数据库隔离级别一般都高于该级别
简而言之第一个事务没提交,别的事物就能读,这种数据不一定是正确的因为人家可能回滚呀!
案例:
张三发工资了,老婆让张三把工资打到他老婆的账号上,但是该事务并未提交,就让老婆去查看,老婆
一看真的打了钱了,高高兴兴关了网页,此时张三急中生智进行回滚,钱瞬间回来,一次蒙混了一个月
工资。所以张三老婆看到的数据我们称之为“脏数据”。
必须开两个事务

SET transaction isolation level read uncommitted;
1-张三转账

start transaction;
UPDATE user set balance = balance - 10000 where id = 1;
UPDATE user set balance = balance + 10000 where id = 2;
2-老婆查账

start transaction;
select * from user where id = 2;
commit;
3-张三回滚

rollback;
4-老婆某天查账

start transaction;
select * from user where id = 2;
commit;
出现上述情况,即我们所说的脏读 ,两个并发的事务,“事务A:领导给singo发工资”、“事务B:singo
查询工资账户”,事务B读取了事务A尚未提交的数据。

5.4.3 读已提交
能读到别的事物已经提交的数据。

A事务在本次事务中,对自己操作过的数据,进行了多次读取发现数据不一致,不可重复读。

简单点说就是不能让我好好的重复读,一个事务里读出来的数据都不一样,让不让人干活了。

针对的语句update和delete,会导致不可重复读

张三拿着工资卡去消费,系统读取到卡里确实有10200元,而此时她的老婆也正好在网上转账,把张三工资卡的2000元转到另一账户,并在张三之前提交了事务,当张三扣款时,系统检查到张三的工资卡和上次读取的不一样了,张三十分纳闷,明明卡里有钱,为何…

SET transaction isolation level read committed;
1-张三去消费了,显示有余额,贼高兴

start transaction;
select * from user where id = 1;
2-老婆转账

start transaction;
UPDATE user set balance = balance + 10000 where id = 2;
UPDATE user set balance = balance - 10000 where id = 1;
commit;
3-张三查账,同一个事务里,发现钱少了。

select * from user where id = 1;
当隔离级别设置为Read committed 时,避免了脏读,但是可能会造成不可重复读。
大多数数据库的默认级别就是Read committed,比如Sql Server , Oracle。如何解决不可重复读这一问
题,请看下一个隔离级别。

5.4.4 可重复读
A事务在本次事务中对未操作的数据进行多次查询,发现第一次没有,第二次出现了就像幻觉一样。或者第一次有而第二次没有。针对delete和insert。

案例

张三的老婆在银行部门工作,她时常通过银行内部系统查看张三的账户信息。有一天,她正在查询到张三账户信息时发现张三只有一个账户,心想这家伙应该没有私房钱。此时张三在另外一家分行右开了一个账户,准备存私房钱。一次同时张三老婆点击了打印,结果打印出的张三账户居然多了一个,真是奇怪。

set transaction isolation level repeatable read;
1-张三开启事务

start transaction;
2-老婆查账户

start transaction;
select * from user where name = ‘张三’;
3-张三趁机开户

insert into user values(3,‘张三’,10000);
commit;
4-老婆再查询并打印,应该发现张三多了一个账户,但是没有。

select * from user where name = ‘张三’;
MySQL 通过多版本并发控制(MVCC)(快照读/一致性读)其实解决了幻读问题。

原理:事务开启后,将历史数据存一份快照,其他事务增加与删除的数据,对于当前事务来说是不可见的。

当然还能这样测一下

set transaction isolation level repeatable read;
1-张三开启事务

start transaction;
2-老婆查账户,给张三开了个账户

start transaction;
select * from user where name = ‘张三’;
insert into user values(3,‘张三’,10000);
3-张三不知道老婆给他开了账户,自己也开一个,看见自己没有这个3号账户,居然不能插入,很奇幻。

select * from user where name = ‘张三’;
insert into user values(3,‘张三’,10000);
5.4.5 串行化
事务A和事务B,事务A在操作数据库时,事务B只能排队等待
这种隔离级别很少使用,吞吐量太低,用户体验差
这种级别可以避免“幻像读”,每一次读取的都是数据库中真实存在数据,事务A与事务B串行,而不并发。
别的地方一用这个数据就不能修改删除,直到别的地方提交
SET transaction isolation level serializable;
1-张三

begin;
select * from user;
2-老婆

begin;
select * from user;
3-张三操作发现卡住了

delete from user where id = 9;
4-老婆这边一提交,那边就能操作了

commit;
六、MySQL锁的机制
数据库锁机制简单来说,就是数据库为了保证数据的一致性,使各种共享资源在被访问时变得有序而设计的一种规则。

MysQL的锁机制比较简单最著的特点是不同的存储引擎支持不同的锁机制。 InoDB支持行锁,(有时也会升级为表锁)MyISAM只支持表锁。

表锁的特点就是开销小、加锁快,不会出现死锁。锁粒度大,发生锁冲突的概率小,并发度相对低。

行锁的特点就是开销大、加锁慢,会出现死锁。锁粒度小,发生锁冲突的概率高,并发度搞。今天我们讲锁主要从InnoDB引擎来讲,因为它既支持行锁、也支持表锁。

6.1 InnoDB行锁的种类
InnoDB默认的事务隔离级别是RR,并且参数innodb_locks_unsafe_for_binling=0的模式下,行锁有三种。

6.1.1 记录锁(Record Lock)
(1)不加索引,两个事务修改同一行记录

事务一:

begin;
update teacher set teacher_no = ‘T2010005’ where name = ‘wangsi’;
事务二:

begin;
update teacher set teacher_no = ‘T2010006’ where name = ‘wangsi’;
发现卡住了:

事务一提交了,事务二才获取了。

(2)不加索引,两个事务修改同一表非同行记录

事务一:

begin;
update teacher set teacher_no = ‘T2010005’ where name = ‘wangsi’;
事务二:

begin;
update teacher set teacher_no = ‘T2010006’ where name = ‘wangsi’;
发现卡住了:

事务一提交了,事务二才获取了。

说明锁的是表!

(3)加索引,修改同一行记录,不行

事务一:

begin;
update teacher set teacher_no = ‘T2010005’ where name = ‘wangsi’;
事务二:

begin;
update teacher set teacher_no = ‘T2010006’ where name = ‘wangsi’;
发现卡住了:

事务一提交了,事务二才获取了。

(4)加索引,修改同表的不同行,可以修改

事务一:

begin;
update teacher set teacher_no = ‘T2010008’ where name = ‘wangsi’;
事务二:

begin;
update teacher set teacher_no = ‘T2010009’ where name = ‘jiangsi’;
发现都可一顺利修改,说明锁的的确是行。

证明行行锁是加在索引上的,这是标准的行级锁。

6.1.2 间隙锁(GAP Lock)
在RR这个级别下,为了避免幻读,引入了间隙锁,他锁定的是记录范围,不包含记录本身,也就是不允许在范围内插入数据。

间隙:根据检索条件向下寻找最靠近检索条件的记录值A作为左区间,向上寻找最近索引条件的记录值B作为右区间,即锁定的间隙为(A,B)

查看隔离级别:

show variables like ‘%iso%’;
唯一索引 等值判断只会产生记录锁,范围查询会产生间隙锁

普通索引 等值判断也会产生记录锁(普通字段不唯一)

第一步把teacher表的id的4改成8

事务一:

begin;
select * from teacher where id < 6 lock in share mode;
事务二:

begin;
insert into teacher values (5,‘zhangnan’,‘T888888’);
发现卡住了,因为他会把小于6的数据锁定,并不允许间隙中间的值插入:

事务三:

begin;
insert into teacher values (9,‘huijun’,‘T66666666’);
发现成功了,因为9不在锁定的范围。

6.1.3 记录锁和间隙锁的组合(next-key lock)
临键锁,是记录锁和间隙锁的组合,当InnoDb扫描索引时会先对索引记录加上记录锁,在对索记录两边加上间隙锁。

6.2 表锁
1、对于InnoDB表,在绝大部分情况下都应该使用行级锁,因为事务和行锁往往是我们之所以选择InnoDB表的理由。但在个另特殊事务中,也可以考虑使用表级锁。

第一种情况是:事务需要更新大部分或全部数据,表又比较大,如果使用默认的行锁,不仅这个事务执行效率低,而且可能造成其他事务长时间锁等待和锁冲突,这种情况下可以考虑使用表锁来提高该事务的执行速度。

第二种情况是:事务涉及多个表,比较复杂,很可能引起死锁,造成大量事务回滚。这种情况也可以考虑一次性锁定事务涉及的表,从而避免死锁、减少数据库因事务回滚带来的开销。

2、在InnoDB下 ,使用表锁要注意以下两点。

(1)使用LOCK TALBES虽然可以给InnoDB加表级锁,但必须说明的是,表锁不是由InnoDB存储引擎层管理的,而是由其上一层MySQL Server负责的,仅当autocommit=0、innodb_table_lock=1(默认设置)时,InnoDB层才能知道MySQL加的表锁,MySQL Server才能感知InnoDB加的行锁,这种情况下,InnoDB才能自动识别涉及表级锁的死锁;否则,InnoDB将无法自动检测并处理这种死锁。

(2)在用LOCAK TABLES对InnoDB锁时要注意,要将AUTOCOMMIT设为0,否则MySQL不会给表加锁;事务结束前,不要用UNLOCAK TABLES释放表锁,因为UNLOCK TABLES会隐含地提交事务;COMMIT或ROLLBACK不能释放用LOCAK TABLES加的表级锁,必须用UNLOCK TABLES释放表锁,正确的方式见如下语句。

例如,可以按如下做:

lock tables teacher write,student read;
select * from teacher;
commit;
unlock tables;
表锁的力度很大,慎用。

6.3 InnoDB的锁类型
InnoDB的锁类型主要有读锁(共享锁)、写锁(排他锁)、意向锁和MDL锁。

6.3.1 读锁
读锁(共享锁,shared lock)简称S锁。一个事务获取了一个数据行的读锁,其他事务能获得该行对应的读锁但不能获得写锁,即一个事务在读取一个数据行时,其他事务也可以读,但不能对该数行增删改的操作。

简而言之:就是可以多个事务读,但只能一个事务写。

读锁有两种select方式的应用:

第一种是自动提交模式下的select查询语句,不需加任何锁,直接返回查询结果,这就是一致性非锁定读。
第二种就是通过select… lock in share mode被读取的行记录或行记录的范围上加一个读锁,让其他事务可以读,但是要想申请加写锁,那就会被阻塞。
事务一:

begin;
select * from teacher where id = 1 lock in share mode;
事务二:

begin;
update teacher set name = ‘lucy2’ where id = 1;
卡住了,说明加了锁了。

6.3.2 写锁
写锁,也叫排他锁,或者叫独占所,简称x锁。一个事务获取了一个数据行的写锁,其他事务就不能再获取该行的其他锁与锁优先级最高。

写锁的应用就很简单了,有以下两种情况:

简而言之:就是只能有一个事务操作这个数据,别的事务都不行。

(1)一些DML语句的操作都会对行记录加写锁。

事务一:

begin;
update teacher set name = ‘lucy’ where id = 1;
事务二:

begin;
update teacher set name = ‘lucy2’ where id = 1;
卡住了,说明加了锁了。

你发现他还能读,这是应为mysql实现了MVCC模型。

(2)比较特殊的就是select for update,它会对读取的行记录上加一个写锁,那么其他任何事务戴不能对被锁定的行上加任何锁了,要不然会被阻塞。

事务一:

begin;
select * from teacher where id = 1 for update;
事务二:

begin;
update teacher set name = ‘lucy2’ where id = 1;
卡住了,说明加了锁了。

你发现他还能读,这是应为mysql实现了MVCC模型。

6.3.3 MDL锁
MySQL 5.5引入了meta data lock,简称MDL锁,用于保证表中元数据的信息。在会话A中,表开启了查询事务后,会自动获得一个MDL锁,会话B就不可以执行任何DDL语句,不能执行为表中添加字段的操作,会用MDL锁来保证数据之间的一致性。

元数据就是描述数据的数据,也就是你的表结构。意识是在你开启了事务之后获得了意向锁,其他事务就不能更改你的表结构。

6.3.4 意向锁
在mysql的innodb引擎中,意向锁是表级锁,意向锁有两种

意向共享锁(IS) 是指在给一个数据行加共享锁前必须获取该表的意向共享锁

意向排它锁(IX) 是指在给一个数据行加排他锁前必须获取该表的意向排他锁

意向锁和MDL锁都是为了防止在事务进行中,执行DDL语句导致数据不一致。

6.4 从另一个角度区分锁的分类
6.4.1 乐观锁
乐观锁大多是基于数据版本记录机制实现,一般是给数据库表增加一个"version"字段。读取数据时,将此版本号一同读出,之后更新时,对此版本号加一。此时将提交数据的版本数据与数据库表对应记录的当前版本信息进行比对,如果提交的数据版本号大于数据库表当前版本号,则予以更新,否则认为是过期数据。

比如下单操作:

查询出商品信息。

select name, version from teacher where id = 1;
根据商品信息生成订单。

将商品数量减1。

update teacher set name = ‘lucy’,version = version + 1 where id = 1 and
version = 3
6.4.2 悲观锁
总有刁民想害朕

悲观锁依靠数据库提供的锁机制实现。MySQL中的共享锁和排它锁都是悲观锁。数据库的增删改操作默认都会加排他锁,而查询不会加任何锁。此处不赘述。

6.5 锁等待和死锁
锁等待是指一个事务过程中产生的锁,其他事务需要等待上一个事务释放它的锁,才能占用该资源。如果该事务一直不释放,就需要持续等待下去,直到超过了锁等待时间,会报一个等待超时的错误。

MysQL中通过innodb_lock_wait_timeout参数控制,单位是秒。

死锁的条件

两行记录,至少两个事务
事务A 操作 第n行数据,并加锁 update teacher set name = ‘a’ where id = 1;
事务B 操作 第m行数据,并加锁 update teacher set name = ‘b’ where id = 2;
事务A 操作 第m行数据 update teacher set name = ‘c’ where id = 2;
事务B 操作 第n行数据 update teacher set name = ‘d’ where id = 1;
形成死锁 Deadlock found when trying to get lock; try restarting transaction
死锁是指两个或两个以上的进程在执行过程中,因争夺资源而造成的一种互相等待的现象,就是所谓的
锁资源请求产生了回路现象,即死循环。

InnoDB引擎可以自动检测死锁并回滚该事务好不容易执行了一个业务给我回滚了,所以死锁尽量不要
出现。

6.6 如何避免死锁
出现死锁并不可怕,但我们要尽量避免死锁
如果不同的程序会并发处理同一个表,或者涉及多行记录,尽量约定使用相同顺序访问表,可以大
大减少死锁的发生。
业务中尽量采用小事务,避免使用大事务,要即使提交和回滚事务,可减少死锁产生的概率。
同一个事务中尽量做到一次锁定所需要的所有资源,减少死锁发生的概率。
对于非常容易发生死锁的业务,可以尝试使用升级锁的力度,该用表锁减少死锁的发生。
6.7 MVCC,多版本并发控制
此章节本文转载至:https://blog.csdn.net/SnailMann 的博客

MVCC ,全称Multi-Version Concurrency Control ,即多版本并发控制。MVCC是一种并发控制的方法,一般在数据库管理系统中,实现对数据库的并发访问,在编程语言中实现事务内存。

MVCC在MySQL InnoDB中的实现主要是为了提高数据库并发性能,用更好的方式去处理读-写冲突,做到即使有读写冲突时,也能做到不加锁,非阻塞并发读

6.7.1 什么是当前读和快照读?
在学习MVCC多版本并发控制之前,我们必须先了解一下,什么是MySQL InnoDB下的当前读和快照读?

当前读

像select lock in share mode( 共享锁), select for update ; update, insert ,delete( 排他锁)这些操作都是一种当前读,为什么叫当前读?就是它读取的是记录的最新版本,读取时还要保证其他并发事务不能修改当前记录,会对读取的记录进行加锁

快照度

像不加锁的select操作就是快照读,即不加锁的非阻塞读;快照读的前提是隔离级别不是串行级别,串行级别下的快照读会退化成当前读;之所以出现快照读的情况,是基于提高并发性能的考虑,快照读的实现是基于多版本并发控制,即MVCC,可以认为MVCC是行锁的一个变种,但它在很多情况下,避免了加锁操作,降低了开销;既然是基于多版本,即快照读可能读到的并不一定是数据的最新版本,而有可能是之前的历史版本

说白了MVCC就是为了实现读-写冲突不加锁,而这个读指的就是快照读, 而非当前读,当前读实际上是一种加锁的操作,是悲观锁的实现

6.7.2 当前读,快照读和MVCC的关系
准确的说,MVCC多版本并发控制指的是 “维持一个数据的多个版本,使得读写操作没有冲突” 这么一个概念。仅仅是一个理想概念
而在MySQL中,实现这么一个MVCC理想概念,我们就需要MySQL提供具体的功能去实现它,而快照读就是MySQL为我们实现MVCC理想模型的其中一个具体非阻塞读功能。而相对而言,当前读就是悲观锁的具体功能实现
要说的再细致一些,快照读本身也是一个抽象概念,再深入研究。MVCC模型在MySQL中的具体实现则是由 3个隐式字段, undo日志 , Read View等去完成的,具体可以看下面的MVCC实现原理
6.7.3 MVCC能解决什么问题
数据库并发场景有三种,分别为:

读-读:不存在任何问题,也不需要并发控制
读-写:有线程安全问题,可能会造成事务隔离性问题,可能遇到脏读,幻读,不可重复读
写-写:有线程安全问题,可能会存在更新丢失问题,比如第一类更新丢失,第二类更新丢失
MVCC带来的好处是?

多版本并发控制(MVCC)是一种用来解决读-写冲突的无锁并发控制,也就是为事务分配单向增长的时间戳,为每个修改保存一个版本,版本与事务时间戳关联,读操作只读该事务开始前的数据库的快照。

所以MVCC可以为数据库解决以下问题

在并发读写数据库时,可以做到在读操作时不用阻塞写操作,写操作也不用阻塞读操作,提高了数据库并发读写的性能

同时还可以解决脏读,幻读,不可重复读等事务隔离问题,但不能解决更新丢失问题

小结一下咯

总之,MVCC就是因为大牛们,不满意只让数据库采用悲观锁这样性能不佳的形式去解决读-写冲突问题,而提出的解决方案,所以在数据库中,因为有了MVCC,所以我们可以形成两个组合:

MVCC + 悲观锁

MVCC解决读写冲突,悲观锁解决写写冲突

MVCC + 乐观锁

MVCC解决读写冲突,乐观锁解决写写冲突

这种组合的方式就可以最大程度的提高数据库并发性能,并解决读写冲突,和写写冲突导致的问题

6.7.4 MVCC的实现原理
MVCC的目的就是多版本并发控制,在数据库中的实现,就是为了解决读写冲突,它的实现原理主要是依赖记录中的 3个隐式字段, undo日志 , Read View 来实现的。所以我们先来看看这个三个point的概念

隐式字段

每行记录除了我们自定义的字段外,还有数据库隐式定义的DB_TRX_ID , DB_ROLL_PTR , DB_ROW_ID 等字段

DB_TRX_ID

6byte,最近修改(修改/插入)事务ID:记录创建这条记录/最后一次修改该记录的事务ID

DB_ROLL_PTR

7byte,回滚指针,指向这条记录的上一个版本(存储于rollback segment里)

DB_ROW_ID

6byte,隐含的自增ID(隐藏主键),如果数据表没有主键,InnoDB会自动以DB_ROW_ID产生一个聚簇索引

实际还有一个删除flag隐藏字段, 既记录被更新或删除并不代表真的删除,而是删除flag变了

在这里插入图片描述

如上图, DB_ROW_ID 是数据库默认为该行记录生成的唯一隐式主键, DB_TRX_ID 是当前操作该记录的事务ID,而DB_ROLL_PTR 是一个回滚指针,用于配合undo日志,指向上一个旧版本

undo日志

undo log主要分为两种:

insert undo log

代表事务在insert 新记录时产生的undo log , 只在事务回滚时需要,并且在事务提交后可以被立即丢弃

update undo log

事务在进行update 或delete 时产生的undo log ; 不仅在事务回滚时需要,在快照读时也需要;所以不能随便删除,只有在快速读或事务回滚不涉及该日志时,对应的日志才会被purge 线程统一清除

purge线程,想成是一个环卫工人

从前面的分析可以看出,为了实现InnoDB的MVCC机制,更新或者删除操作都只是设置一下老记录的deleted_bit,并不真正将过时的记录删除。
为了节省磁盘空间,InnoDB有专门的purge线程来清理deleted_bit为true的记录。为了不影响MVCC的正常工作,purge线程自己也维护了一个read view(这个read view相当于系统中最老活跃事务的read view);如果某个记录的deleted_bit为true,并且DB_TRX_ID相对于purge线程的read view可见,那么这条记录一定是可以被安全清除的。
对MVCC有帮助的实质是update undo log , undo log 实际上就是存在rollback segment 中旧记录链,它的执行流程如下:

1、 比如persion表有一条记录,记录如下, name 为Jerry, age 为24岁, 隐式主键是1, 事务ID 和回滚指针,我们假设为NULL

在这里插入图片描述

2、 现在来了一个事务1 对该记录的name 做出了修改,改为Tom

在事务1 修改该行(记录)数据时,数据库会先对该行加排他锁
然后把该行数据拷贝到undo log 中,作为旧记录,既在undo log中有当前行的拷贝副本
拷贝完毕后,修改该行name 为Tom,并且修改隐藏字段的事务ID为当前事务1的ID, 我们默认从1 开始,之后递增,回滚指针指向拷贝到undo log 的副本记录,既表示我的上一个版本就是它
事务提交后,释放锁
在这里插入图片描述

3、又来了个事务2 修改person表的同一个记录,将age 修改为30岁

在事务2 修改该行数据时,数据库也先为该行加锁
然后把该行数据拷贝到undo log 中,作为旧记录,发现该行记录已经有undo log 了,那么最新的旧数据作为链表的表头,插在该行记录的undo log 最前面
修改该行age 为30岁,并且修改隐藏字段的事务ID为当前事务2 的ID, 那就是2 ,回滚指针指向刚刚拷贝到undo log 的副本记录
事务提交,释放锁
在这里插入图片描述

从上面,我们就可以看出,不同事务或者相同事务的对同一记录的修改,会导致该记录的undo log 成为一条记录版本线性表,既链表, undo log 的链首就是最新的旧记录,链尾就是最早的旧记录(当然就像之前说的该undo log的节点可能是会purge线程清除掉,向图中的第一条insert undo log,其实在事务提交之后可能就被删除丢失了,不过这里为了演示,所以还放在这里)

6.7.5 Read View(读视图)
什么是Read View,说白了Read View就是事务进行快照读操作的时候生产的读视图(Read View),在该事务执行的快照读的那一刻,会生成数据库系统当前的一个快照,记录并维护系统当前活跃事务的ID(当每个事务开启时,都会被分配一个ID, 这个ID是递增的,所以最新的事务,ID值越大)

所以我们知道 Read View 主要是用来做可见性判断的, 即当我们某个事务执行快照读的时候,对该记录创建一个 Read View 读视图,把它比作条件用来判断当前事务能够看到哪个版本的数据,既可能是当前最新的数据,也有可能是该行记录的undo log 里面的某个版本的数据。

Read View遵循一个可见性算法,主要是将 要被修改的数据 的最新记录中的DB_TRX_ID (即当前事务ID)取出来,与系统当前其他活跃事务的ID去对比(由Read View维护),如果 DB_TRX_ID 跟ReadView的属性做了某些比较,不符合可见性,那就通过 DB_ROLL_PTR 回滚指针去取出 Undo Log 中的DB_TRX_ID 再比较,即遍历链表的 DB_TRX_ID (从链首到链尾,即从最近的一次修改查起),直到找到满足特定条件的 DB_TRX_ID , 那么这个DB_TRX_ID所在的旧记录就是当前事务能看见的最新老版本

那么这个判断条件是什么呢?

在展示之前,我先简化一下Read View,我们可以把Read View简单的理解成有三个全局属性

trx_list(名字我随便取的)
一个数值列表,用来维护Read View生成时刻系统正活跃的事务ID

up_limit_id
记录trx_list列表中事务ID最小的ID

low_limit_id
ReadView生成时刻系统尚未分配的下一个事务ID,也就是目前已出现过的事务ID的最大值+1

首先比较DB_TRX_ID < up_limit_id , (当前事务id小于最小id),说明你的事务最早发生,如果小于,则当前事务能看到DB_TRX_ID 所在的记录
接下来判断 DB_TRX_ID 大于等于 low_limit_id ,(说明这是事务最新) 如果大于等于则代表DB_TRX_ID 所在的记录在Read View 生成后才出现的,那对当前事务肯定不可见,如果小于则进入下一个判断
判断DB_TRX_ID 是否在活跃事务之中, trx_list.contains(DB_TRX_ID) ,如果在,则代表我Read View 生成时刻,你这个事务还在活跃,还没有Commit,你修改的数据,我当前事务也是看不见的;如果不在,则说明,你这个事务在Read View 生成之前就已经Commit了,你修改的结果,我当前事务是能看见的
6.7.6整体流程
我们在了解了隐式字段,undo log, 以及Read View的概念之后,就可以来看看MVCC实现的整体流程是怎么样了

整体的流程是怎么样的呢?我们可以模拟一下

当事务2对某行数据执行了快照读,数据库为该行数据生成一个Read View 读视图,假设当前事务ID为2,此时还有事务1和事务3在活跃中,事务4在事务2快照读前一刻提交更新了,所以Read View记录了系统当前活跃事务1,3的ID,维护在一个列表上,假设我们称为trx_list

事务1 事务2 事务3 事务4
事务开始 事务开始 事务开始 事务开始
…… …… …… 修改且已提交
进行中 快照读 进行中
…… …… ……
Read View不仅仅会通过一个列表trx_list 来维护事务2 执行快照读那刻系统正活跃的事务ID,还会有两个属性up_limit_id (记录trx_list列表中事务ID最小的ID), low_limit_id (**记录trx_list列表中事务ID最大的ID,也有人说快照读那刻系统尚未分配的下一个事务ID也就是目前已出现过的事务ID的最大值+1,我更倾向于后者 ;所以在这里例子中 up_limit_id 就是1,low_limit_id 就是4 + 1 = 5,trx_list集合的值是1,3,Read View如下图

在这里插入图片描述

我们的例子中,只有事务4修改过该行记录,并在事务2执行快照读前,就提交了事务,所以当前该行当前数据的undo log 如下图所示;我们的事务2在快照读该行记录的时候,就会拿该行记录的DB_TRX_ID 去跟up_limit_id , low_limit_id和活跃事务ID列表(trx_list) 进行比较,判断当前事务2 能看到该记录的版本是哪个。
在这里插入图片描述

所以先拿该记录DB_TRX_ID 字段记录的事务ID 4 去跟Read View 的的up_limit_id 比较,看4是否小于up_limit_id(1),所以不符合条件,继续判断 4 是否大于等于low_limit_id (5),也不符合条件,最后判断4 是否处于trx_list 中的活跃事务, 最后发现事务ID为4 的事务不在当前活跃事务列表中, 符合可见性条件,所以事务4修改后提交的最新结果对事务2 快照读时是可见的,所以事务2 能读到的最新数据记录是事务4 所提交的版本,而事务4提交的版本也是全局角度上最新的版本
在这里插入图片描述

也正是Read View生成时机的不同,从而造成RC,RR级别下快照读的结果的不同
6.7.7 MVCC相关问题
RR是如何在RC级的基础上解决不可重复读的?

当前读和快照读在RR级别下的区别:

表1

事务A 事务B
开启事务 开启事务
快照读(无影响)查询金额为500 快照读查询金额为500
更新金额为400
提交事务
select 快照读金额为500
select lock in share mode 当前读金额为400
在上表的顺序下,事务B的在事务A提交修改后的快照读是旧版本数据,而当前读是实时新数据400

表2

事务A 事务B
开启事务 开启事务
快照读(无影响)查询金额为500
更新金额为400
提交事务
select 快照读金额为400
select lock in share mode 当前读金额为400
而在表2 这里的顺序中,事务B在事务A提交后的快照读和当前读都是实时的新数据400,这是为什么呢?

这里与上表的唯一区别仅仅是表1 的事务B在事务A修改金额前快照读过一次金额数据,而表2 的事务B在事务A修改金额前没有进行过快照读。
所以我们知道事务中快照读的结果是非常依赖该事务首次出现快照读的地方,即某个事务中首次出现快照读的地方非常关键,它有决定该事务后续快照读结果的能力

我们这里测试的是更新,同时删除和更新也是一样的,如果事务B的快照读是在事务A操作之后进行的,事务B的快照读也是能读取到最新的数据的

RC,RR级别下的InnoDB快照读有什么不同?

正是Read View 生成时机的不同,从而造成RC,RR级别下快照读的结果的不同

在RR级别下的某个事务的对某条记录的第一次快照读会创建一个快照及Read View, 将当前系统活跃的其他事务记录起来,此后在调用快照读的时候,还是使用的是同一个Read View,所以只要当前事务在其他事务提交更新之前使用过快照读,那么之后的快照读使用的都是同一个Read View,所以对之后的修改不可见;
即RR级别下,快照读生成Read View时,Read View会记录此时所有其他活动事务的快照,这些事务的修改对于当前事务都是不可见的。而早于Read View创建的事务所做的修改均是可见
而在RC级别下的,事务中,每次快照读都会新生成一个快照和Read View, 这就是我们在RC级别下的事务中可以看到别的事务提交的更新的原因
总之在RC隔离级别下,是每个快照读都会生成并获取最新的Read View;而在RR隔离级别下,则是同一个事务中的第一个快照读才会创建Read View, 之后的快照读获取的都是同一个Read View。

6.8 Redo log
MySQL数据库作为现在互联网公司内最流行的关系型数据库,相信大家都有工作中使用过。InnoDB是MySQL里最为常用的一种存储引擎,主要面向在线事务处理(OLTP)的应用。今天就让我们来探究一下InnoDB是如何一步一步实现事务的,这次我们先讲事务实现的redo log。

首先我们先明确一下InnoDB的修改数据的基本流程,当我们想要修改DB上某一行数据的时候,InnoDB是把数据从磁盘读取到内存的缓冲池上进行修改。数据在内存中被修改,与磁盘中相比就存在了差异,我们称这种有差异的数据为脏页。InnoDB对脏页的处理不是每次生成脏页就将脏页刷新回磁盘,这样会产生海量的IO操作,严重影响InnoDB的处理性能。对于此,InnoDB有一套完善的处理策略,与我们这次主题关系不大,表过不提。既然脏页与磁盘中的数据存在差异,那么如果在这期间DB出现故障就会造成数据的丢失。为了解决这个问题,redo log就应运而生了。

6.8.1 Redo log工作原理
在讲Redo log工作原理之前,先来学习一下MySQL的一些基础:

6.8.1.1 日志类型
在这里插入图片描述

redo log在数据库重启恢复的时候被使用,因为其属于物理日志的特性,恢复速度远快于逻辑日志。而我们经常使用的binlog就属于典型的逻辑日志。

6.8.1.2 checkpoint
坦白来讲checkpoint本身是比较复杂的,checkpoint所做的事就是把脏页给刷新回磁盘。所以,当DB重启恢复时,只需要恢复checkpoint之后的数据。这样就能大大缩短恢复时间。当然checkpoint还有其他的作用。

6.8.1.3 LSN(Log Sequence Number)
LSN实际上就是InnoDB使用的一个版本标记的计数,它是一个单调递增的值。数据页和redo log都有各自的LSN。我们可以根据数据页中的LSN值和redo log中LSN的值判断需要恢复的redo log的位置和大小。

6.8.1.4 工作原理
好的,现在我们来看看redo log的工作原理。说白了,redo log就是存储了数据被修改后的值。当我们提交一个事务时,InnoDB会先去把要修改的数据写入日志,然后再去修改缓冲池里面的真正数据页。

我们着重看看redo log是怎么一步步写入磁盘的。redo log本身也由两部分所构成即重做日志缓冲(redolog buffer)和重做日志文件(redo log file)。这样的设计同样也是为了调和内存与磁盘的速度差异。InnoDB写入磁盘的策略可以通过innodb_flush_log_at_trx_commit 这个参数来控制。

在这里插入图片描述

当该值为1时,当然是最安全的,但是数据库性能会受一定影响。

为0时性能较好,但是会丢失掉master thread还没刷新进磁盘部分的数据。

这里我想简单介绍一下master thread,这是InnoDB一个在后台运行的主线程,从名字就能看出这个线程相当的重要。它做的主要工作包括但不限于:刷新日志缓冲,合并插入缓冲,刷新脏页等。masterthread大致分为每秒运行一次的操作和每10秒运行一次的操作。master thread中刷新数据,属于checkpoint的一种。所以如果在master thread在刷新日志的间隙,DB出现故障那么将丢失掉这部分数据。

当该值为2时,当DB发生故障能恢复数据。但如果操作系统也出现宕机,那么就会丢失掉,文件系统没有及时写入磁盘的数据。

这里说明一下,innodb_flush_log_at_trx_commit 设为非0的值,并不是说不会在master thread中刷新日志了。master thread刷新日志是在不断进行的,所以redo log写入磁盘是在持续的写入。

6.8.1.5 宕机恢复
DB宕机后重启,InnoDB会首先去查看数据页中的LSN的数值。这个值代表数据页被刷新回磁盘的LSN的大小。然后再去查看redo log的LSN的大小。如果数据页中的LSN值大说明数据页领先于redo log刷新回磁盘,不需要进行恢复。反之需要从redo log中恢复数据。

6.8.2 redo log的结构
其实这一部分内容日常工作中很少涉及到,稍微了解一下就足够了。

6.8.2.1 log block
Redo log的存储都是以 块(block) 为单位进行存储的,每个块的大小为512字节。同磁盘扇区大小一致,可以保证块的写入是原子操作。

块由三部分所构成,分别是 日志块头(log block header),日志块尾(log block tailer),日志本身。日志头占用12字节,日志尾占用8字节。故每个块实际存储日志的大小为492字节。

6.8.2.2 log group
一个日志文件由多个块所构成,多个日志文件形成一个重做日志文件组(redo log group)。不过,log group是一个逻辑上的概念,真实的磁盘上不会这样存储。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值