InnoDB存储引擎特性之两次写
-
InnoDB存储引擎第一大特性是插入缓冲,有兴趣的可以看看我的这篇博客:
InnoDB存储引擎特性之插入缓冲——详解 -
对于InnoDB存储引擎体系架构不太清楚的朋友可以看看这篇博客:
MySQL—InnoDB存储引擎体系架构——详解
1.为什么要有两次写
- 如果说插入缓冲(Insert Buffer)给InnoDB带来的是性能上的提升,那么两次写(doublewrite)带给InnoDB的就是数据页的可靠性
- 当发生数据库宕机时,可能InnoDB存储引擎正在写入到某个页到表中,而这个页只写了一部分,比如16KB的页,只写了4KB,之后就发生了宕机,这种情况就称为部分写失效。
- 面对这种情况,其实我们可以想到的就是通过重做日志进行恢复,这的确是一个办法,但是我们要知道,重做日志是对页的物理操作(例如:偏移量2000,写‘hello world’记录),但是如果这个页本身就发生了损坏,就无法进行重做了。
- 也就是说在使用重做日志之前,用户需要页损坏之前的一个副本,当发生写入失效时,可以通过这个页的副本进行还原再进行重做,这就doublewrite!
2.Doublewrite概述
- 所以两次写是什么呢?
- 简单来说就是InnoDB进行脏页刷新的时候,并不是直接写回磁盘,而是先将脏页复制到内存中的一个区域,然后再分两次顺序的写入磁盘(这仅仅是简单概述,其实没有这么简单,后面会详细讲解)
3.Doublewrite构造
- doublewrite由两部分组成
1)一部分是内存中的doublewrite buffer,大小为2MB
2)另一部分是物理磁盘上共享表空间中的连续128页,即两个区,大小同样为2MB(这里可以称为doubwite页)
4.Doublewrite过程
- 对缓冲池脏页进行刷新时,并不直接写入磁盘,而是会通过memcpy函数将脏页复制到内存中的doublewrite buffer
- 然后通过doublewrite buffer再分两次,每次1MB顺序的写入共享表空间的物理磁盘的两个区中(doublewrite页)
- 然后马上调用fsync函数,同步磁盘,避免缓冲写带来的问题
- 总的来说:也就是说先将数据复制到Doublewrite Buffer,然后第一次写入共享表空间,第二次写物理磁盘数据
5.Doublewrite的优点
- 由于doublewrite页的物理空间是连续的,所以写的时候开销并不是很大
- 如果是刷新脏页写入磁盘的时候宕机了,那么就直接通过doublewrite页进行恢复就行了
- 如果是写doublewrite页宕机了,就可以通过重做日志恢复,重新写doublewrite buffer