MySQL
MySQL 执行流程和缓冲池
MySQL 事务
MySQL 日志–redo log
MySQL 日志–undo log
本文参考尚硅谷康师傅的 MySQL课程
MySQL日志--undo log
redo log
是事务持久性的保证,undo log
是事务原子性的保证。在事务中更新数据
的前置操作
其实是要 先写入一个undo log
1、理解 undo log
每当我们要对一条记录做改动时(
INSERT
、DELETE
、UPDATE
),都需要"留一手"——把回滚时所需的东西记下来。
MySQL把这些为了回滚而记录的这些内容定义为:undo log
由于SELECT
并不会修改任何用户记录,所以在杳询操作行时,并不需要记录相应的undo log
生成undo log
也会生成redo log
,这是因为undo log
也需要持久性的保护
2、undo log 的作用
- 回滚数据
undo是逻辑日志
,因此只是将数据库逻辑地恢复到原来的样子。所有修改都被逻辑地取消了,但是数据结构和页本身在回滚之后可能大不相同。 - MVCC
在InnoDB
存储引擎中MVCC
的实现是通过undo来完成。当用户读取一行记录时,若该记录已经被其他事务占用,当前事务可以通过undo读取之前的行版本信息,以此实现非锁定读取
3、undo log 的存储结构
3.1、回滚段的参数设置
innodb_undo_directory
设置rollback segment
文件所在的路径。这意味着rollback segment
可以存放在共享表空间
以外的位置,即可以设置为独立表空间
。该参数的默认值为“”,表示当前InnoDB存储引擎的目录innodb_undo_logs
设置rollback segment
的个数,默认值为128。在InnoDB1.2版本中,该参数用来替换之前版本的参数innodb_rollback_segments
innodb_undo_tablespaces
设置构成rollback segment
文件的数量,这样rollback segment
可以较为平均地分布在多个文件中。设置该参数后,会在路径innodb_undo_directory
看到undo为前缀的文件,该文件就代表rollback segment
文件
3.2、undo页的重用
当我们开启一个事务需要写undo log的时候,就得先去undo log segment中去找到一个空闲的位置,当有空位的时候,就去申请undo页,在这个申请到的undo页中进行undo log的写入。
为每一个事务分配一个页,是非常浪费的(除非你的事务非常长),假设你的应用的TPS(每秒处理的事务数目)为1000,那么1s就需要1000个页,大概需要16M的存储,1分钟大概需要1G的存储。
于是undo页就被设计的可以重用了,当事务提交时,会被放到一个链表中,然后判断undo页的使用空间是否小于3/4,如果小于3/4的话,则表示当前的undo页可以被重用,那么它就不会被回收,其他事务的undo log可以记录在当前undo页的后面。
3.3、回滚段与事务
- 每个事务只会使用一个回滚段,一个回滚段在同一时刻可能会服务于多个事务
- 当一个事务开始的时候,会分配一个回滚段,当数据被修改时,原始的数据会被复制到回滚段
- 在回滚段中,事务会不断填充盘区,直到事务结束或所有的空间被用完。如果当前的盘区不够用,事务会在段中请求扩展下一个盘区,如果所有已分配的盘区都被用完,事务会覆盖最初的盘区或者在回滚段允许的情况下扩展新的盘区来使用
- 回滚段存在于undo表空间中,在数据库中可以存在多个undo表空间,但同一时刻只能使用一个undo表空间
mysql> show variables like 'innodb_undo_tablespaces';
+-------------------------+-------+
| Variable_name | Value |
+-------------------------+-------+
| innodb_undo_tablespaces | 2 |
+-------------------------+-------+
1 row in set (0.00 sec)
#undo log的数量,最少为2,undo log的truncate操作有purge协调线程发起。
#在truncate某个undo log表 空间的过程中,保证有一个可用的undo log可用。
5.当事务提交时,InnoDB存储引擎会做以下两件事情
- 将undo log放入列表中,以供之后的purge操作
- 判断undo log所在的页是否可以重用(低于3/4可以重用),若可以分配给下个事务使用
3.4、回滚段中的数据分类
-
未提交的回滚数据(uncommitted undo information):
该数据所关联的事务并未提交,用于实现读一致性,所以该数据不能被其他事务的数据覆盖。 -
已经提交但未过期的回滚数据(committed undo information):
该数据关联的事务已经提交,但是仍受到undo retention参数的保持时间的影响。 -
事务已经提交并过期的数据(expired undo information):
事务已经提交,而且数据保存时间已经超过undo retention参数指定的时间,属于已经过期的数据。当回滚段满了之后,会优先覆盖"事务已经提交并过期的数据"。
事务提交后并不能马上删除undo log及undo log所在的页。这是因为可能还有其他事务需要通过undo log来得到行记录之前的版本。故事务提交时将undo log放入一个链表中,是否可以最终删除undo log及undo log所在页由purge线程来判断。
4、undo log 的类型
- insert undo log
在insert
操作中产生的undo log。因为insert操作的记录,只对事务本身可见,对其他事务不可见(这是事务隔离性的要求),故该undo log可以在事务提交后直接删除。不需要进行purge操作 - update undo log
对delete
和update
操作产生的undo log。该undo log可能需要提供MVCC机制,因此不能在事务提交时就进行删除。提交时放入undo log链表,等待purge线程进行最后的删除
5、undo log 的生命周期
5.1、简要生成过程
假设有2个数值,分别为A=1和B=2,然后将A修改为3,B修改为4
1. start transaction;
2.记录A=1到undo log;
3. update A = 3;
4.记录A=3 到redo log;
5.记录B=2到undo loq;
6. update B = 4;
7.记录B = 4到redo log;
8.将redo log刷新到磁盘;
9. commit
- 在1-8步骤的任意一步系统宕机,事务未提交,该事务就不会对磁盘上的数据做任何影响
- 如果在8-9之间宕机
- redo log 进行恢复
- undo log 发现有事务没完成进行回滚
- 若在9之后系统宕机,内存映射中变更的数据还来不及刷回磁盘,那么系统恢复之后,可以根据redo log把数据刷回磁盘
只有Buffer Pool的流程:
有了Redo Log和Undo Log之后:
在更新Buffer Pool中的数据之前,我们需要先将该数据事务开始之前的状态写入Undo Log中。假设更新到一半出错了,我们就可以通过Undo Log来回滚到事务开始前
5.2、详细生成过程
几个隐藏列:
DB_ROW_ID:行号
DB_TRX_ID:事务 ID
DB_ROLL_PTR:回滚指针
执行INSERT时
插入的数据都会生成一条insert undo log,并且数据的回滚指针会指向它。undo log会记录undo log的序号、插入主键的列和值…,那么在进行rollback的时候,通过主键直接把对应的数据删除即可
执行UPDATE时
对于更新的操作会产生update undo log,并且会分更新主键的和不更新主键的
不更新主键:
这时会把老的记录写入新的undo log,让回滚指针指向新的undo log,它的undo no是1,并且新的undo log会指向老的undo log (undo no=0)
更新主键:
对于更新主键的操作,会先把原来的数据deletemark标识打开,这时并没有真正的删除数据,真正的删除会交给清理线程去判断,然后在后面插入一条新的数据,新的数据也会产生undo log,并且undo log的序号会递增
可以发现每次对数据的变更都会产生一个undo log,当一条记录被变更多次时,那么就会产生多条undo log,undo log记录的是变更前的日志,并且每个undo log的序号是递增的,那么当要回滚的时候,按照序号依次向前推,就可以找到我们的原始数据了
6、小结
undo log是逻辑日志,对事务回滚时,只是将数据库逻辑地恢复到原来的样子
redo log是物理日志,记录的是数据页的物理变化,undo log不是redo log的逆过程