如果发生写失效,可以通过重做日志进行恢复。重做日志中记录的是对页的物理操作。如果这个页已经发生了损坏,再对其进行重做是没有意义的。也就是说,在应用重做日志前,用户需要一个页的副本,当写入失效发生时,先通过页的副本来还原该页,再进行重做,这就是doublewrite。
组成
doublewrite由两部分组成:
- 内存中的doublewrite buffer,大小2MB。
- 物理磁盘上共享表控件中的连续的128个页,即两个区(extent),大小2MB.
工作
- 在对缓冲池的脏页进行刷新时,并不直接写磁盘,而是会通过memcpy函数将脏页首先复制到内存中的doublewrite buffer。
- 通过doublewrite buffer再分两次,每次1MB顺序地写入共享表空间的物理磁盘上,然后马上调用fsync函数,同步磁盘,避免缓冲写带来问题。因为doublewrite是连续的,因此这个过程也是顺序写的,开销不是很大。
- 在完成doublewrite页的写入后,再将doublewrite buffer中的页写入各个表空间文件中,此时的写入时离散的。
- 如果操作系统在将该页写入磁盘的过程中发生了崩溃,在恢复过程中,InnoDB存储引擎可以从共享表空间中的doublewrite中找到该页的一个副本,将其复制到表空间文件,再应用重做日志。
注意
参数skip_innodb_doublewrite可以禁用doublewrite功能,不过会导致写失效问题。只能应用于从服务器(slave server),提供较快的性能。
不过对于需要提供数据高可靠性的主服务器(master server),任何时候用户都要开启doublewrite功能。