有点类似与JVM的垃圾回收机制,当删除表中的行数据时,MySQL不会自动回收垃圾内存(没有JVM那么强大的垃圾回收机制),于是结果内存空间如下:
我们删除2,4,6行数据后,数据页中只是会将对应行的数据抹去,但是其仍然占有磁盘空间,所以我们发现有时候删除了大量的数据行后,可用的磁盘空间并没有增加,之后用户如果想插入ID值为2,4,6(要在删除行的ID区间内)的记录的话可以直接加在这张表上,但是不能在这张表中加入其余ID值不在区间内的记录行。
重建表
于是MySQL为了释放删除数据后的空间想出了一个办法,就是建立一张新表将未删除的数据都按顺序拷贝到这张新表上(重建表),然后删除旧表(此处类似于JVM垃圾回收机制的“标记整理”算法),从而释放磁盘空间,如下图
online DDL
以上过程存在一个问题,就是在拷贝表数据的时候会加锁,也就是表数据无法更新,为了改进这点,出现了另一种拷贝表数据方法(online DDL,这个就类似于JVM的G1垃圾收集器,可以并发的进行)。在表进行拷贝的时候我们不去更新表数据,但是可以先将对表的更新操作记录到一个row log中,当拷贝完成后,将拷贝期间在row log中记录的更新刷新到新表中,如下图所示:
- 步骤一:一边拷贝原表数据到临时的新表
- 步骤二:将临时表替换为新表,在磁盘中释放原表的空间
- 步骤三:回放row log中的记录,更新新表中的数据
ps:
以上MySQL整理磁盘碎片空间的方法和JVM的GC算法相似(将碎片内存空间放到一起/处理拷贝时的并发问题),感觉学到后来,很多知识都是相通的,都是基于一个合理的解决方案和算法,具体的实现细节应该都大同小异。
参考文章:
https://time.geekbang.org/column/article/72388