Oracle-RAC数据库丢失某个current redo log的故障处理

本文介绍了当RAC数据库中一个实例可以打开但另一个因CURRENTREDOLOG损坏无法访问时的处理方法,包括检查数据文件状态、清理故障日志、修复UNDO表空间不一致,以及后续数据一致性恢复策略。
摘要由CSDN通过智能技术生成

如果一个RAC数据库,其中一个实例是可以打开的,打开另外一个实例的时候,发现有REDO LOG损坏无法访问,而且这个REDO LOG是CURRENT的,那么怎么处理呢?如果是一个单实例的数据库,那么遇到这个问题的处理方法只有一个,就是强制RESETLOGS打开数据库,如果无法强制打开,设置_allow_resetlogs_corruption隐含参数可能能打开,当然如果数据字典表出现了需要恢复的情况,那么数据库可能会打不开。这回我们遇到的是RAC,而且某个实例是打开状态的,而另外一个实例因为CURRENT REDO LOG损坏而无法打开。根据对数据库的理解,如果单实例能够打开,说明这个数据库的数据字典是基本一致的,有可能存在的问题是第二个实例的REDO丢失部分数据,导致某些数据出现不一致,另外一个实例的UNDO出现不一致。因此从基本原理上看,不RESETLOGS应该可以解决问题。下面老白简单介绍下这类问题的处理方法。

如果遇到了类似情况,可能会出现下面的提示:

Errors in file/u01/....../diag/rdbms/orcl/orcl2/trace/orcl_ora_12864.trc:

ORA-16038: log 3 sequence# 6 cannotbe archived

ORA-00354: corrupt redo log blockheader

ORA-00312: online log 3 thread 2:'+RACDG2/orcl/onlinelog/group_3.350.567156743'

ORA-00312: online log 3 thread 2:'+RACDG2/orcl/onlinelog/group_3.349.567156751'

1、首先用SYSDBA登录打开的实例,检查数据文件是否有处于RECOVER状态的,如果有那么这个文件可能会不一致,可能需要进行处理,强制使之ONLINE,或者使用工具导出该文件中的数据,然后删除该文件进行重建。如果没有文件处于RECOVER状态,那么恭喜你,后面将会比较简单。

2、在打开的实例,执行alter database clear [unarchived] logfile group <group #>; 清除故障的REDO LOG,本例子是:

 Alter database clearunarchived logfile group 3;

 3、这时候你就可以启动那个无法启动的实例了。

4、不过启动后你可能会发现该实例的ALERT LOG中出现了一些ORA-600错误,代码为[4XXX],这时候,可能你的UNDO是处于不一致的。最简单的情况是直接创建一个新的UNDO表空间,把这个实例的UNDO切换过去。有些ORA-600处理起来比较复杂,比如[4193],处理的时候,可能要使用隐含参数把有问题的回滚段通过_offline_rollback_segments或者干脆用_corrupted_rollback_segments将这些有问题的回滚段隔离,有些时候还需要设置一些EVENT来阻止回滚操作的进行。这样数据库就可以继续使用了。

5、不过这时候数据库是存在一些数据不一致的地方的,会有一些坏块,对这种情况,一般有两种后续处理方法,第一种是继续找存在问题的对象,进行修复,还有一种是导出数据,重建数据库,再倒入数据,使数据库重新恢复正常,一般情况下,对于一个十分重要的数据库,第二种可能是最佳方法,当然需要一定的停机时间才可以进行类似的操作。

作者:白鳝

  • 3
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值