innodb double write原理
基本原理是将数据写两份
将Dirty page刷到磁盘时,先将page刷到磁盘上的一个区域tablespace,然后择机将page拷贝到数据文件对应的位置。
tablespace是innodb在磁盘上分配的一块区域,包含100个page。
每个page都有自己的checksum,来校验本身数据的正确性。
用double write的原因:
为了处理partial page write
因为innodb的page大小是16k,而文件系统写磁盘的单位一般是4k,所以会出现这个page的前4k刷到磁盘,而由于机器袥机或是程序退出,而导致page中的其他数据没有刷到磁盘的情况。即使有raid卡,有电池可以保证机器袥机,也可以有电量支持将数据刷新成功,但是当电池电量不足时,会导致出现partial page。
异常情况下的恢复:
恢复时,tablespace中的数据page校验出错,则直接丢弃。
如果tablespace中的数据page是正确的,则会将tablespace中的数据page,刷新到实际数据所在的位置。
性能影响:
在tablespace中写刷page是顺序写,对性能影响不大。