今天是2021-2-27日,已经很多年没有写笔记了,期间每年也帮一些客户也处理过很多Oracle数据各类问题,之所以没写主要是“懒”。随之it发展,确实现在发生了翻天覆地的变化,发现不断学习确实需要的,学习使人进步。
正好今天有个课题《断电灾备演练》,让我回想起14年某客户asm磁盘头损坏导致重大业务事件,以此作为笔记,在回顾下当时处理问题思路。
问题描述:
光纤误动导致突然磁盘头损坏(具体情况也忘记了)。
问题分析:
业务无法写入数据,查看数据库alert日志查看asm的alert日志发现磁盘组有块盘有问题,貌似有块磁盘好好的居然不属于原先磁盘组了,断定或许是磁盘头损坏了。
问题处理思路:
既然磁盘头坏了,那么就需要修复。思路方案选择往往是最谨慎最重要的,一个好的方案个人认为高效、安全最为重要。
方案一(推荐方案):新创建磁盘组,然后使用rman通过备份恢复。优点:稳妥、安全。缺点:不一定高效(数据量在TB级别,恢复时间慢)
方案二:往往在最极端情况下采用(如没备份、数据量大),可以通过kfed进行修复。修复之前需提前备份。缺点:要求专业性强、一旦操作不慎将导致数据无法挽回(11.1.0.7之前太繁琐).优点:恢复速度快,可能5分钟内就搞定。
记得当时是采用方案二:
注意事项: