一次数据库迁移过后,运维反馈数据库空间不足了。原来规划导入10G数据,现在占用空间比预期大量3倍。这个迁移过程我知道,中途还有insert into select的动作。但是处理的数据有点大,导致处理失败。
其实这也就是表膨胀的主要因素。
创建一个表,写入一些数据。看到这个表现在大小是114688字节。
经过多次反复插入(主要证明数据多了文件大小线性增加)。看到这个表现在大小是131072字节。
再次写入insert into select写入,但是执行回退后。数据未能写入,但是表现在大小是163840字节。结果是表变大了,这个结果可能和大多数人想象中的不一样。大多数人可能觉得回退后,数据没有写入数据文件。
其实很多数据库即使处理大事务,但是提交会很快。因为这些过程的数据和日志也都一直在写,所以最后提交很快。
那也就是这里可以证明,为什么案例实际导入10G,但是占用空间很大。因为中途执行几次都被Kill回滚了。