binlog和redolog
1、重要的日志模块:redo log
1.1 粉板–redo log
一个例子:
《孔乙己》这篇文章,酒店掌柜有一个粉板
,专门用来记录客人的赊账记录。如果赊账的人不多,那么他可以把顾客名和账目写在板上。
但如果赊账的人多了,粉板总会有记不下的时候,这个时候掌柜一定还有一个专门记录赊账的账本
。
如果有人要赊账或者还账的话,掌柜一般有两种做法:
- 一种做法是直接把账本翻出来,把这次赊的账加上去或者扣除掉;
- 另一种做法是先在粉板上记下这次的账,等打烊以后再把账本翻出来核算。
在生意红火柜台很忙时,掌柜一定会选择后者,因为前者操作实在是太麻烦了。首先,你得找到这个人的赊账总额那条记录。你想想,密密麻麻几十页,掌柜要找到那个名字,可能还得带上老花镜慢慢找,找到之后再拿出算盘计算,最后再将结果写回到账本上。
所以先在粉板上记下这次的账,等打烊以后再把账本翻出来核算
这里的粉板可以理解redo log
, 账本可以理解为磁盘
具体来说,当有一条记录需要更新的时候,InnoDB 引擎就会先把记录写到 redo log(粉板)
里面,并更新内存,这个时候更新就算完成了。同时,InnoDB 引擎会在适当的时候,将这个操
作记录更新到磁盘里面,而这个更新往往是在系统比较空闲的时候做,这就像打烊以后掌柜做的
事。
1.2 粉板redo log有大小限制
但如果某天赊账的特别多,粉板写满了,又怎么办呢?这个时候掌柜只好放下手中的活儿,把粉板中的一部分赊账记录更新到账本
中,然后把这些记录从粉板上擦掉
,为记新账腾出空间。
与此类似,InnoDB 的 redo log 是固定大小的,比如可以配置为一组 4 个文件,每个文件的大
小是 1GB,那么这块“粉板”总共就可以记录 4GB 的操作。从头开始写,写到末尾就又回到开
头循环写
wirte pos 是当前记录的位置,一边写一边后移,写到第 3 号文件末尾后就回到 0 号文件开头。
checkpoint 是当前要擦除的位置,也是往后推移并且循环的,擦除记录前要把记录更新到数据
文件。
write pos 和 checkpoint 之间的是“粉板”上还空着的部分,可以用来记录新的操作。如果
write pos 追上 checkpoint,表示“粉板”满了,这时候不能再执行新的更新,得停下来先擦
掉一些记录,把 checkpoint 推进一下。
有了 redo log
,InnoDB
就可以保证即使数据库发生异常重启,之前提交的记录都不会丢失,
这个能力称为crash-safe。
2、重要的日志模块:binlog
MySQL 整体来看,其实就有两块:
一块是 Server 层,它主要做的是 MySQL功能层面的事情;
还有一块是引擎层,负责存储相关的具体事宜。上面我们聊到的粉板 redolog 是 InnoDB 引擎特有的日志
Server 层也有自己的日志,称为 binlog(归档日志)。
为什么要有两个日志?
MySQL 自带的引擎是 MyISAM,但是 MyISAM没有 crash-safe 的能力,binlog 日志只能用于归档。
而 InnoDB 是另一个公司以插件形式引入MySQL 的,
既然只依靠 binlog 是没有 crash-safe 能力的,所以 InnoDB 使用另外一套日志系
统——也就是 redo log 来实现 crash-safe 能力。
这两种日志有以下三点不同。
- redo log 是 InnoDB 引擎特有的;binlog 是 MySQL 的 Server 层实现的,所有引擎都可
以使用。 - redo log 是
物理日志
,记录的是“在某个数据页上做了什么修改”;binlog 是逻辑日志
,
记录的是这个语句的原始逻辑,比如“给 ID=2 这一行的 c 字段加 1 ”。 - redo log 是循环写的,空间固定会用完;binlog 是可以追加写入的。“追加写”是指
binlog 文件写到一定大小后会切换到下一个,并不会覆盖以前的日志。
mysql执行update命令的整个流程
首先,可以确定的说,查询语句
的那一套流程,更新语句也是同样会走一遍。
mysql> update T set c=c+1 where ID=2;
如图所示
图中浅色框表示是在 InnoDB 内部执行的,
深色框表示是在执行器中执行的。
-
- 执行器先找引擎取 ID=2 这一行。ID 是主键,引擎直接用树搜索找到这一行。如果 ID=2
这一行所在的数据页本来就在内存中,就直接返回给执行器;否则,需要先从磁盘读入内
存,然后再返回。
- 执行器先找引擎取 ID=2 这一行。ID 是主键,引擎直接用树搜索找到这一行。如果 ID=2
-
- 执行器拿到引擎给的行数据,把这个值加上 1,比如原来是 N,现在就是 N+1,得到新的
一行数据,再调用引擎接口写入这行新数据。
- 执行器拿到引擎给的行数据,把这个值加上 1,比如原来是 N,现在就是 N+1,得到新的
-
- 引擎将这行新数据更新到内存中,同时将这个更新操作记录到 redo log 里面,此时 redo
log 处于 prepare 状态。然后告知执行器执行完成了,随时可以提交事务。
- 引擎将这行新数据更新到内存中,同时将这个更新操作记录到 redo log 里面,此时 redo
-
- 执行器生成这个操作的 binlog,并把 binlog 写入磁盘。
-
- 执行器调用引擎的提交事务接口,引擎把刚刚写入的 redo log 改成提交(commit)状
态,更新完成。
- 执行器调用引擎的提交事务接口,引擎把刚刚写入的 redo log 改成提交(commit)状
为什么必须有“两阶段提交”呢?
这是为了让两份日志之间的逻辑一致。
简单说,redo log 和 binlog 都可以用于表示事务的提交状态,而两阶段提交就是让这两个状态
保持逻辑上的一致。