【MySQL进阶之路 | 高级篇】简谈undo日志

1. Undo日志

redo log是事务持久化的保证,undo log是事务原子性的保证。在事务中更新数据的前置操作其实是先写入一个undo log。

1.1 如何理解Undo日志

事务需要保证原子性,也就是事务中的操作要么全部完成,要么什么都不做。但有时候事务执行到一半会出现一些情况,比如:

  • 情况1:事务执行过程中可能遇到各种错误,比如服务器本身的错误,操作系统错误,甚至是突然断电导致的错误。
  • 情况2:程序员可以在事务执行过程中手动输入ROLLBACK语句结束当前事务。

以上情况出现,我们需要把数据改回原来的样子,这个过程叫回滚。这样就可以造成一个假象:这个事务看起来什么都没做。所以符合原子性的要求。

每当我们要对一条记录做改动时(这里的改动可以是指INSERT,DELETE,UPDATE),都需要留一手,把回滚的所需的东西记下来。比如:

  • 你插入一条记录时,至少要把这条记录的主键值记下来,之后回滚的时候只需要把这个主键值对应的记录删除就好了(对于每个INSERT,InnoDB存储引擎会完成一个DELETE)。
  • 你删除了一个记录,至少要把这条记录的内容都记录下来,这样之后回滚的时候再把这些内容组成的记录插入到表中就好了。(对于每个DELETE,InnoDB存储引擎会执行一个INSERT)。
  • 你更改一条记录,至少要把修改这条记录之前的旧值都记录下来,这样回滚的时候再把这条记录更新为旧值就好了(对于每个UPDATE, InnoDB存储引擎会执行一个相反的UPDATE,把修改前的行放回去)。

MySQL把这些为了回滚而记录的这些内容称之为撤销日志或回滚日志(undo log)。注意,由于查询操作并不会修改任何用户记录,所以在查询操作执行时,并不需要相应的undo日志。

此外,undo log也会产生redo log,也就是undo log的产生会伴随着redo log的产生,这是因为undo log也需要持久化。

1.2 Undo日志的作用

1). 作用1:回滚数据

用户对undo日志可能有误解:undo日志用于将数据库物理地恢复到执行语句或事务之前的样子。但事实并非如此。undo log是逻辑日志,因此只是将数据库逻辑地恢复到原来的样子。所有的修改都被逻辑上的取消了,但是数据结构和页本身在回滚后可能大不相同。

这是因为在多用户并发系统中,可能会有数十数百条并发事务。数据库的主要任务是协调对数据记录的并发访问。比如:一个事务字修改当前一个页中某几条记录的时候,同时还有别的事务在对同一页中另一条记录进行修改。因此,不能将一个页回滚到事务开始的样子,这样会影响到其他事务正在进行的工作。

2). 作用2:MVCC

undo log的另一个作用是MVCC,即在InnoDB存储引擎中MVCC的实现是通过undo来完成的。当用户读取一行记录的时候,若该记录已经被其他事务占用,当前事务可以通过undo读取之前的行版本信息,以此实现非锁定读取。

1.3 undo的存储引擎

1). 回滚段与undo页

InnoDB对undo log的管理采用段的方式,也就是回滚段(rollback segment)。每个回滚段记录了1024个undo log segment,而在每个undo log segment段中进行了undo页的申请。

  • 在InnoDB1.1版本前(不包括1,1版本),只有一个rollback segment,因此支持同时在线的事务限制为1024.虽然对绝大多数的应用来说已经够用了。
  • 从 1.1版本开始InnoDB支持最大128个rollback segment,故其支持同时在线的事务限制提高到了128*1024.

查看系统变量:show variables like 'innodb_undo_logs';

虽然InnoDB1.1版本支持了128个rollback segment,但是这些rollback segment都存储在共享表空间ibdata中。从InnoDB1.2版本开始,可通过参数对rollback segment做进一步设置。这些参数包括:

  • innodb_undo_directory:设置rollback segment文件所在的路径。这意味着rollback segment可以存放在共享空间以外的位置,即可设置为独立表空间。该参数的默认值为'./' ,表示当前InnoDB存储引擎的目录。
  • innodb_undo_logs:设置rollback segment的个数,默认值是128.在InnoDB1.2版本中,该参数是用来替换版本的参数innodb_rollback_segments。
  • innodb_undo_tablespaces:设置构成rollback segment文件的数量,这样rollback segment可以较为平均的分布在多个文件中。设置该参数后,会在路径innodb_undo_directory看到undo为前缀的文件,该文件就代表了rollback segment文件。
2). undo页的重用

当我们开启一个事务需要写undo log的时候,就得先去undo log segment中去找到一个空闲的位置,当有空间的时候,就去申请undo页,在这个申请到的undo页中进行undo log的写入。我们知道MySQL默认一页的大小是16kb。为每个事务分配一个页是非常浪费的(除非你的事务特别长),于是undo页就被设计的可以重用了,当事务提交时,并不会立即删除undo页。因为重用,所有这个undo页可能混杂着其他事务的undo log。undo log在commit后,会被放到一个链表中,然后判断undo页的使用是否小于3/4,如果小于,则表示当前的undo页可以被重用,那么它就不会被回收,其他事务的undo log页的后面。由于undo log是离散的,所以清理对应的磁盘空间时,效率不高。

3). 回滚段与事务
  • 每个事务只会使用一个回滚段,一个回滚段在同一时刻可能会服务于多个事务。
  • 当一个事务开始的时候,会制定一个回滚段,在事务进行的过程中,当数据被修改时,原始的数据会被复制到回滚段。
  • 子啊回滚段中,事务会不断填充盘区,直到事务结束或者所有的空间被用完。如果当前的盘区不够用,事务会在段中请求下一个盘区,如果所有已经分配的盘区都被用完,事务会覆盖最初的盘区或者在回滚段允许的情况下扩展新的盘区来使用。
  • 回滚段存在于undo表空间中,在数据库中可以存在多个undo表空间,但同一时刻只能使用一个undo表空间。
  • 当事务提交时,InnoDB存储引擎会做以下两件事:将undo log放入列表中,以供之后的purge操作;判断undo log所在的页是否可以重用,若可以分配给下一个事务使用。
4). 回滚段中的数据分类
  1. 未提交的回滚数据:该数据所关联的事务并未提交,用于实现读一致性,所以该数据不能被其他事务所覆盖。
  2. 已经提交但未过期的回滚数据:该数据关联的事务已经提交,但是受到undo retention参数的保持时间的影响。
  3. 事务已经提交并过期的数据:事务已经提交,而且数据保存的时间已经超过了undo retention参数指定的时间,属于已经过期的数据。当回滚段满了之后,会优先覆盖事务已经提交并过期的数据。

事务提交后并不能马上删除undo log及undo log所在的页。这是因为可能还有其他事务需要通过undo log来得到行记录之前的版本。故事务提交时将undo log放入一个链表中,是否可以最终删除undo log及undo log所在页由purge线程来判断。

1.4 undo的类型

在InnoDB存储引擎中,undo log分为:

insert undo log:

insert undo log是指在insert操作产生undo log。因为insert操作的记录,只对事务本身可见,对其他事务不可见(这是事务隔离性的要求),所以undo log可以在事务提交后直接删除。不需要进行purge操作。

update undo log:

update undo log记录是对delete和update操作产生的undo log。该undo log可能需要提供MVCC机制。因为不能在事务提交时进行删除。提交时放入undo log的链表,等待purge线程进行最后的删除。

1.5 小结

undo log是逻辑日志,对事务的回滚时,只是将数据库逻辑地恢复到原来的样子。

redo log是物理日志,记录的是数据页的物理变化,undo log不是redo log的逆过程。

  • 5
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值