08年5月4日,一个永远都不能忘记的日子--对于一个数据库管理员的我来说,这天负责远备的部门打电话给我说rman远备时报错,始终不能全备成功,要求我重启数据库和服务器试试,不幸的事情发生了……
系统重启后,ocfs报错,无法挂载盘阵中的一个lun,我当时觉得天要塌了一样,1个多t的东西就这么没了,赶紧找硬件售后,重启盘阵,依然不行,通过本本登录emc后台,lun1已经不受spb管理,无法挂载下去,我的天啊,查看日志,居然天底下最倒霉的事都让我给碰上了,我做的raid组里面居然同时坏了两个盘,仔细查看发觉我的盘阵最早的时候售后没有做hotspare,赶紧电话远备方,我要冒火了,现在才说平时远备的时候报错了的,没有一个完好的全备,电话找了个数据恢复公司,苦苦等了两天把硬盘给我拿过来,满怀欣喜的插上去,两天是白等了,只好重建lun了,我痛心不已的数据啊,唯一让我欣慰的是我的数据是分为照片和基本信息两个表空间存储的,丢失了照片,还又基本信息可用,drop掉我苦苦建立的n多个数据文件,一切重头再来……
惨痛的教训让我明白了,数据备份的重要,包括存储上的,数据库方面的,总之要做的很多,包括平时的维护也是不可或缺的。