1 binlog
mysql整体看有两块:一块是server 层主要负责功能层面;一块是引擎层,负责存储层面。而redo log 是innodb引擎特有的日志,而server层也有自己的日志,成为binlog(归档日志)binlog没有crash-safe能力只用于归档
2 redo log
-
wal 技术的关键点就是先写日志,在写磁盘
-
当有一条记录需要更新时,innodb引擎会先把记录写到redo log里面并更新内存,这时候更新就算完成了,同时innodb引擎会在适当的时候将这个操作记录更新到磁盘里面,而这个更新就是在系统比较空闲的时候
-
innodb的redo log 是固定大小的,可以配置一组4个文件,每个文件大小是1gb,从头开始写,写到末尾就回到开头循环写。
-
write pos 是当前记录的位置,一边写一边后移。checkpoint是当前要擦除的位置,也是往后推移且循环的,擦除记录前要把记录更新到数据文件。
-
有了red log ,innodb就可以保证数据库发生异常重启,之前的记录不会丢失,称之为crash-safe。
3 不同点
-
redo log 是innodb引擎特有的;binlog是mysql的server层实现的
-
red log是物理日志,记录的是在某个数据页上做了什么修改;binlog是逻辑日志,记录的是这个语句的原始逻辑
-
逻辑日志: 可以简单理解为记录的就是sql语句 。
-
物理日志: mysql 数据最终是保存在数据页中的,物理日志记录的就是数据页变更 。
-
-
red log 是循环写的,空间固定会用完;binlog是可以追加写的,追加写是指binlog文件到一定大小后会切换到下一个,并不会覆盖以前日志。
4 更新语句执行流程
update T set c=c+1 where ID=2;
-
执行器先找引擎取id=2这一行。id是主键,引擎直接用数搜索找到这一行,如果id=2这一行所在的数据也本来就在内存中,就直接返回给执行器;否则需要先从磁盘读入内存,然后在返回。
-
执行器拿到引擎给的行数据,把此值加上1,的到新的一行数据,在调用引擎接口写入这行新数据
-
引擎将这行新数据更新到内存中,同时将这个更新操作记录到redo log里面,此时redo log处于prepare状态。然后告知执行器完成了,可以随时提交事务
-
执行器生成这个操作的binlog,并把binlog写入磁盘
-
执行器调用引擎的提交事务接口,引擎把刚刚写入的redo log改成提交状态,更新完成
redo log 的写入拆成了两个步骤:prepare 和 commit,这就是"两阶段提交"。
5 为什么需要两阶段提交
当我们需要回复数据库时
-
首先找到最近的一次全量备份,将这个备份回复到临时库
-
然后从备份的时间点开始,将备份的binlog依次取出来,重返到以前时刻
此时临时库就和之前的线上库一样了, 然后就可以把表数据从临时库取出来
原因:
-
先写read log 而不写bin log 回导致回复不到原来数据
-
先写bin log 不写read log 会导致还没真正写入就回复了
redo log 和 binlog 都可以用于表示事务的提交状态,而两阶段提交就是让这两个状态保持逻辑上的一致。