2014年09月03日亿万城市项目由于需要缩减外网机器, 对数据库进行迁移,导致外网部分玩家数据异常, 造成一起事故。总结了一下其中发生的问题
1
. 起初考虑热迁移,但是项目中没有类似功能支持,所以选择了停服迁移;(
建议:
不论结果如何都产生负面影响,
数据库热迁移应该作为项目最基本的研发需求, 在项目启动初期开始
)
1. 数据迁移时间评估错误, 迁移数据库大小约为38G, 期初评估迁移时间为3小时,但迁移过程中发现机器磁盘性能较差,dump数据库的数据很慢,导致停机时间延长至9个小时左右, 对外网造成比较大影响;(
建议:在迁移比较大的数据库时, 最好先模拟测试