概述:
一个800G的数据库,底层存储为IBM DS4300,此套存储上运行着多个单节点数据库,底层为RAID5.09年6月初由于一块盘出现黄灯,工程师按正常操作更换了此块盘,操作后均正常。
约一周后,目标库数据文件出现坏块(dbv检测),除tools表空间外的数据文件都出现大量坏块(从几百个到几万个),问题是此库没有任何备份(RMAN,EXP),数据也相当重要。数据库在启动时,甚至都没到报SYSTEM01.dbf文件有坏块的几乎,根据ORACLE原厂的说法,ORACLE的boot引导都出了问题。
ORACLE工程师现场处理了一天,无果;IBM原厂检查存储,均正常(errpt没有错误、存储的硬盘灯没有黄色报警),问题陷入了一个矛盾的状态;几天后,此套存储的另一个单点库的几个数据文件也或多或少出现了坏块。
问题:
根据我对ORACLE的理解,坏块的产生有物理级的也有逻辑级的,物理级的应该从存储层(或系统层)有所显示(比如黄色报警灯,亦或是errpt有所显示),但此案例不具备这种迹象;逻辑级别的坏块,ORACLE也确实有多种原因会导致,但是,不会产生的这么集中和量大。
我的这个目标库并发会话数不大,业务逻辑是从一个口定期通过应用导入数据;其它口几乎没有DML操作,都是进行数据的查询,并发会话数在50左右。
谁能从另一角度给出点引发这个问题的可能?
此问题 gy1982329 于 2009-7-20 10:09 有过如下解释
ds4300的微码问题,你的微码版本可能过低,属于高危微码,在对disk和存储本身作操作(操作指更换存储硬件和改变存储的逻辑结构)时需要进行微码升级,到最新微码,这个我在工作中碰到过,ibm再三提醒过ds4300的微码问题。请以后注意。
[ 本帖最后由 gy1982329 于 2009-7-20 10:09 编辑 ]
来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/388619/viewspace-609673/,如需转载,请注明出处,否则将追究法律责任。
转载于:http://blog.itpub.net/388619/viewspace-609673/