记一次Oracle RAC for aix 存储双控锁盘导致ASM控制文件损坏恢复

   故障场景:AIX IBM存储更换存储控制器电源模块导致存储双控同时掉电,存储双控恢复供电后发生锁盘,IBM解盘后

RAC数据库无法正常启动,启动报错:ORA-00600: internal error code, arguments: [2131], [33], [32], [], [], [], [], [], [], [], [], []

    恢复方案确定:由于损坏的数据库数据量巨大,有30T之多,并且要求尽快打开数据库,可以接受丢失部分数据,

数据库有备份。商议之下,使用备份控制文件恢复数据库,进行数据库的不一致性恢复。

    恢复过程:

1、从磁带库拉取控制文件备份集并恢复到Oracle RAC数据库ASM存储中

--此时尝试启动数据库会遇到报错信息:

ORA-00600: internal error code, arguments: [3020], [718], [2828551], [3014338823], [], [], [], [], [], [], [], []

ORA-10567: Redo is inconsistent with data block (file# 718, block# 2828551, file offset is unknown bytes)

2、生成Oracle的pfile并加入如下三个参数

_allow_resetlogs_corruption=true #跳过redo崩溃,允许resetlogs开库

undo_management=manual  #将undo管理修改为手工管理

event="10513 trace name context forever,level 2" #开10513事件跳过一致性验证

*.cluster_database=false

--此时,尝试启动数据库会遇到报错信息:

ORA-00600: internal error code, arguments: [2662], [3735], [1979553782], [3735], [1979584838], [20971664], [], [], [], [], [], []

3、Oracle数据库使用备份控制文件恢复数据库后,需要推进控制文件的SCN

数据库当前的SCN= 3735.1979584838=(3735*4294967296)+1979584838=16043682435398

giga=16043682435398/1024/1024/1024=14941.843=14941

需要推进的新SCN=14942*1024*1024*1024=16043850334208

Oracle数据库10g控制文件推进可以在pfile中加入参数:_minimum_giga_scn;

ORACLE 11.2.0.4 SCN推进方法oradebug

本次数据库控制文件SCN推进步骤步骤

SQL> oradebug setmypid

Statement processed.

SQL> oradebug dumpvar sga kcsgscn_

kcslf kcsgscn_ [700000000019B70, 700000000019BA0) = 00000000 00000000 00000000 00000000 00000000 00000000 00000000 00000000 00000000 00000000 07000000 00019850 

SQL> oradebug poke 0x700000000019B70 8 16043850334208

BEFORE: [700000000019B70, 700000000019B78) = 00000000 00000000

AFTER:  [700000000019B70, 700000000019B78) = 00000E97 80000000

SQL> oradebug dumpvar sga kcsgscn_

kcslf kcsgscn_ [700000000019B70, 700000000019BA0) = 00000E97 80000000 00000000 00000000 00000000 00000000 00000000 00000000 00000000 00000000 07000000 00019850

SQL>

--此时尝试启动数据库会遇到报错信息:

ORA-00600: internal error code, arguments: [4193], [], [], [], [], [], [], [], [], [], [], []

接下来ORA600[4193]的处理就是ORACLE rac的undo表空间的重建了,需要配合参数:undo_management 和_CORRUPTED_ROLLBACK_SEGMENTS。

 4、处理完ORA600[4193]后,数据库能够启动并打开到open状态,此时最好进行全库备份,如果条件允许,

就重建数据库以逻辑的方式导出故障数据库导新环境。否则,后续的使用中会时不时遇到如下报错信息:

ORA600[6122]和ORA600[KDSGRP1],实质文件是索引逻辑坏块引起的,以drop和create重建相关的索引即可。


来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/29357786/viewspace-2643072/,如需转载,请注明出处,否则将追究法律责任。

转载于:http://blog.itpub.net/29357786/viewspace-2643072/

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值