最近的一个大客户迁移至天翼云,项目中有一个关键要求,必须实现应用数据的秒级同步。为此,我们采购了基于磁盘级的数据复制软件,以及该方式可以兼容mysql、mssql、oracle多种数据库,包打各种上层的数据,结果坑比较多,为此付出了教训。为避免再复错误,今天将经验总结一下。
一、问题发生在哪里?慎用磁盘级的数据灾备软件至数据库环境
刚开始一切风平浪静。我们采购了某厂商的数据灾备软件实现了操作系统级的数据灾备。从Windows、Linux多种环境,实现了数据灾备保存,并恢复操作,一切都好。甚至我们将数据备份的时间设置到了秒级,看上去真的很完美。
问题开始发生。当我们进行RedHat+Oracle进行备份、恢复时,问题出现了,恢复的Oracle数据库无法启动。
问题在哪里?后来,经某专业DBA介绍,一般来说是用这种方式做oracle的容灾备份,在发生灾难以后目标系统的数据库一般是只有2/3的机会是可以正常启动的。专业解释无法启动的原因有&#x