mysql数据库redo/undo log、binlog 的详解及其区别

HD243608836

已于 2022-03-10 17:52:05 修改

阅读量942

点赞数

分类专栏：数据库 sql 文章标签： mysql redo undo bin log

于 2022-03-10 17:38:09 首次发布

原文链接：https://www.jianshu.com/p/57c510f4ec28

版权

数据库同时被 2 个专栏收录

141 篇文章

订阅专栏

sql

87 篇文章

订阅专栏

一、redo log 和 undo log

redo log 是重做日志，提供前滚操作；
undo log 是回退日志，提供回滚操作。

只用 undo log 实现原子性和持久性的缺陷：

事务提交前需要将 Undo Log 写磁盘（提供可回滚功能，保证原子性），这会造成多次磁盘 IO（不考虑各种优化例如 SQL 解析优化等），这些 IO 算是顺序 IO；
事务提交后需要将数据立即更新到数据库中，这又会造成至少一次磁盘 IO，这是一次随机 IO。

如何优化？事务提交后如果能够将数据缓存一段时间，而不是立即更新到数据库，就能将一次次的随机 IO 打包变成一次 IO，可以提高性能。但是这样就会丧失事务的持久性。因此引入了另外一种机制来实现持久化，即 redo log。redo 解决的问题之一就是事务执行过程中的强制刷脏。
在事务提交前，只要将 Redo Log 持久化即可，不需要将数据持久化。当系统崩溃时，虽然数据没有持久化，但是 Redo Log 已经持久化。系统可以根据 Redo Log 的内容，将所有数据恢复到最新的状态。

InnoDB 有 buffer pool（简称bp）。bp 是 物理页 的缓存，对 InnoDB 的任何修改操作都会首先在 bp 的 page 上进行，然后这样的页面将被标记为 dirty 并被放到专门的flush list 上，后续将由专门的刷脏线程阶段性的将这些页面写入磁盘。这样的好处是避免每次写操作都操作磁盘导致大量的随机 IO，阶段性的刷脏可以将多次对页面的修改 merge 成一次IO 操作，同时异步写入也降低了访问的时延。

然而，如果在 dirty page 还未刷入磁盘时，server非正常关闭，这些修改操作将会丢失，如果写入操作正在进行，甚至会由于损坏数据文件导致数据库不可用。为了避免上述问题的发生，Innodb 将所有对页面的修改操作写入一个专门的文件，并在数据库启动时从此文件进行恢复操作，这个文件就是 redo log file。这样的技术推迟了 bp 页面的刷新，从而提升了数据库的吞吐，有效的降低了访问时延。带来的问题是额外的写 redo log 操作的开销（顺序 IO，比随机 IO 快很多），以及数据库启动时恢复操作所需的时间。

划重点：

redo log：记录修改后的“具体值”
redo log 通常是物理日志，记录的是 数据页 的物理修改，而不是某一行或某几行修改成怎样怎样（binlog才是记录某行修改成怎样怎样），它用来恢复提交后的物理数据页(恢复数据页，且只能恢复到最后一次提交的位置)。
undo log：记录修改前的“具体值”
undo log 用来回滚行记录到某个版本。undo log 一般是逻辑日志，根据每行记录进行记录。

二、redo+undo log（二者结合）

将二者结合，提高效率。

要从两个角度来优化，一个就是尽可能减少写入硬盘（即多个事务合并成一次落盘），另一个就是尽量顺序写入（HDD 的随机写入性能远差于顺序写入）。

Undo 记录某数据被修改前的值，可以用来在事务失败时进行 rollback；
Redo 记录某 数据块 被修改后的值，可以用来恢复未写入 data file 的已成功事务更新的数据。
即，

Redo Log 保证事务的持久性
Undo Log 保证事务的原子性（在 InnoDB 引擎中，还用 Undo Log 来实现 MVCC）

比如某一时刻数据库 DOWN 机了，有两个事务，一个事务已经提交，另一个事务正在处理。数据库重启的时候就要根据日志进行前滚及回滚，把已提交事务的更改写到数据文件，未提交事务的更改恢复到事务开始前的状态。即，当数据 crash-recovery 时，通过 redo log 将所有已经在存储引擎内部提交的事务应用 redo log 恢复，所有已经 prepared 但是没有 commit 的 transactions 将会应用 undo log 做 roll back。

小细节总结：为什么只用 redo-log 或者只用 undo-log 不可以

假设只有 undo-log：那么就必须保证提交前刷脏完成，否则宕机时有些修改就在内存中丢失了，破坏了持久性。（这样带来了一个问题，那就是前面提到的性能差）
假设只有 redo-log：那么就不能随心所欲地在事务提交前刷脏，即无法支持大事务。（假如、某张表有 100 亿的 8 字节整数数据，就算不考虑其他东西带来的损耗，光 update 整张表至少要消耗 80G 的内存。如前所述，有了 undo-log，就可以随便刷脏。）

二、redo+undo log 和 binlog对比区别

两者区别还是挺多的，大致如下，

层次不同。
redo/undo 是 innodb 引擎层维护的（innodb引擎独有的），
而 binlog 是 mysql server 层维护的（其他数据库如oracle等也可以实现），跟采用何种引擎没有关系，记录的是所有引擎的更新操作的日志记录。
记录内容不同。
redo/undo 记录的是每个页/每个数据的修改情况，属于物理日志+逻辑日志结合的方式（redo log 是物理日志，undo log 是逻辑日志）。且是循环写，大小不可调。到达上限后，会循环覆盖写。
binlog 记录的都是事务操作内容，binlog 有三种模式：Statement（基于 SQL 语句的复制）、Row（基于行的复制）以及 Mixed（混合模式）。不管采用的是什么模式，当然格式是二进制的。且是追加写，大小可调（可通过max_binlog_size参数调节大小）。当到达指定大小后，后续日志会写入到新文件中，所以适合归档。
记录时机不同。
redo/undo 在 事务执行过程中 会不断的写入，
而 binlog 是在 事务最终提交前 写入的。binlog 什么时候刷新到磁盘跟参数 sync_binlog 相关。

binlog 三种模式对比

上面提到 binlog 有三种格式，各有优缺点：

statement：基于SQL语句的模式，某些语句中含有一些函数，例如 UUID NOW 等在复制过程可能导致数据不一致甚至出错。
row：基于行的模式，记录的是行的变化，很安全。但是 binlog 的磁盘占用会比其他两种模式大很多，在一些大表中清除大量数据时在 binlog 中会生成很多条语句，可能导致从库延迟变大。
mixed：混合模式，根据语句来选用是 statement 还是 row 模式。