上次留了点尾巴,花点时间再说下。
首先对上次的方案做个小结。
先备份表内部分数据,再直接恢复数据到表内。
在主要遇到的场景下,执行时间会少于直接delete,主要原因如下:
1.delete在执行中(删除大量数据),多数是一个或者多个范围条件,索引无法给与优化。执行中需要扫描索引和表内数据,最后还需要写入binlog,这对资源的消耗是非常大的。
2.本文方案在执行中,备份中使用了where,可以通过巧妙的sql语法,充分利用索引。在之后的恢复过程中,drop table和create table执行时间忽略不计,主要是insert对资源消耗大。但是insert操作跟delete相比消耗资源又是相对较小的。备份下来的insert语句都是一次写入多行,效率较高。
综上所述,本文的方案多数情况好于直接delete。另外对于索引的优化维护上,本文方案中实际上重建了索引,已经处于最优状态,无需后续在执行优化。
最后再说补充一个种情况。
有时候,导出的数据需要追加到指定的数据库内。而之前可能已经有一部分数据存在里面。
如果直接使用本文方案,那么会drop之前存的数据,造成数据损失。
在确认数据必须保存同时必须存放在同一个库内同一个表内的情况后,将导出数据语句稍作修改就可以了。</