在mysql中一条查询语句需要经过以下流程:
对于一条更新语句,其实也是需要走上面的流程的(查询缓存这一步没有,上章有提到,在做更新操作时候,会清空查询缓存),只不过更新语句除了上面流程还会涉及到两个重要的日志模块redo log(重做日志)和 binlog(归档日志)
redo log(重做日志)
- 当有一条记录需要更新的时候,InnoDB 引擎就会先把记录写到 redo log里面,并更新内存,这个时候更新就算完成了。
- 同时,InnoDB 引擎会在适当的时候,将这个操作记录更新到磁盘里面,而这个更新往往是在系统比较空闲的时候做
InnoDB的redo log大小是固定的,比如可以配置为一组四个文件,每个文件大小1GB,那么这个redo log就可以一共记录4G的操作。从头开始写,写到末尾就又回到开头循环写。
write pos 是当前记录的位置(写到那里了),一边写一边顺时针往后移动,写到第 3 号文件末尾后就回到 0 号文件开头。
checkpoint 是当前要擦除的位置,也是往后推移并且循环的,擦除记录前要把记录更新到数据文件。擦除之后的绿色区域就又空出来,可以记录新的操作。
tips:因为是循环写,所以如果redo log满了再写,就会覆盖前面写的内容,所以需要在覆盖之前将记录更新到磁盘数据文件。redo log满了,就是write pos 追上check point,这个时候。这时候不能再执行新的更新,得停下来先擦掉一些记录,把 checkpoint 推进一下。
有了 redo log,InnoDB 就可以保证即使数据库发生异常重启,之前提交的记录都不会丢失,这个能力称为 crash-safe。
tips:
- Redo log不是记录数据页“更新之后的状态”,而是记录这个页 “做了什么改动”
binlog(归档日志)
我们知道mysql从整体上看可以分为:server 和 存储引擎。binlog和redo log不同,binlog是属于server层的。也就是你使用任何存储引擎都可以使用binlog.
binlog有两种模式,statement 格式的话是记sql语句, row格式会记录行的内容,记两条,更新前和更新后都有。
redo log和binlog比较:
- binlog日志只能用来归档,并没有crash-safe的功能
- redo log 是 InnoDB 引擎特有的;binlog 是 MySQL 的 Server 层实现的,所有引擎都可以使用
- redo log 是物理日志,记录的是“在某个数据页上做了什么修改”;binlog 是逻辑日志,记录的是这个语句的原始逻辑,比如“给 ID=2 这一行的 c 字段加 1 ”
- redo log 是循环写的,空间固定会用完;binlog 是可以追加写入的。“追加写”是指 binlog 文件写到一定大小后会切换到下一个,并不会覆盖以前的日志。
我们来看下一条update语句执行流程:update T set c=c+1 where ID=2;
- 执行器先找引擎取 ID=2 这一行。ID 是主键,引擎直接用树搜索找到这一行。如果 ID=2 这一行所在的数据页本来就在内存中,就直接返回给执行器;否则,需要先从磁盘读入内存,然后再返回。
- 执行器拿到引擎给的行数据,把这个值加上 1,比如原来是 N,现在就是 N+1,得到新的一行数据,再调用引擎接口写入这行新数据。
- 引擎将这行新数据更新到内存中,同时将这个更新操作记录到 redo log 里面,此时 redo log 处于 prepare 状态。然后告知执行器执行完成了,随时可以提交事务。
- 执行器生成这个操作的 binlog,并把 binlog 写入磁盘。
- 执行器调用引擎的提交事务接口,引擎把刚刚写入的 redo log 改成提交(commit)状态,更新完成。
两阶段提交:
上面的倒数三步,用到了两阶段提交,来保证binlog和redolog的一致性。
1 prepare阶段 2 写binlog 3 commit
- 当在2之前崩溃
重启恢复:后发现没有commit,回滚。备份恢复:binlog中没有本次更新记录 。binlog和redolog一致- 当在3之前崩溃
重启恢复:虽没有commit,但满足prepare和binlog完整,所以重启后会自动commit。备份恢复:binlog有本次更新记录。重启后会commit,最后binlog和redolog也一致
总结:
tips:
- redo log 用于保证 crash-safe 能力。innodb_flush_log_at_trx_commit 这个参数设置成 1 的时候,表示每次事务的 redo log 都直接持久化到磁盘。这个参数建议你设置成 1,这样可以保证 MySQL 异常重启之后数据不丢失
- sync_binlog 这个参数设置成 1 的时候,表示每次事务的 binlog 都持久化到磁盘。这个参数也建议你设置成 1,这样可以保证 MySQL 异常重启之后 binlog 不丢失。
下一章:事务隔离