在Oracle的运行过程中,由于操作失误可能会造成内部元数据的损坏,进而影响到系统的一些基础功能和正常处理。一旦发生这种故障,对内部数据字典的重建就是我们需要进行的处理。
本篇从一个损坏故障为入手点,介绍了如何进行Oracle元数据对象的重建。
1、故障场景
一个朋友的测试库最近出现很多“古怪”的错误,比如exp/imp操作异常中断、pl/sql中元数据信息无法展现和异常报错。这种情况下,笔者向朋友索要的对应的alert_log日志文件。结果发现很多错误信息。
Sat Jun 23 06:36:37 2012
Errors in file /u01/diag/rdbms/wilson/wilson/trace/wilson_m001_3667.trc:
ORA-00604: error occurred at recursive SQL level 1
ORA-04063: package body "SYS.PRVT_HDM" has errors
ORA-06508: PL/SQL: could not find program unit being called: "SYS.PRVT_HDM"
ORA-06512: at line 1
(篇幅原因,有省略…..)
Sat Jun 23 06:53:39 2012
Exception [type: SIGSEGV, Address not mapped to object] [ADDR:0x34] [PC:0x92C0E13, kzpchkc()+4425] [flags: 0x0, count: 1]
Errors in file /u01/diag/rdbms/wilson/wilson/trace/wilson_ora_3619.trc (incident=12215):
ORA-07445: 出现异常错误: æ ¸å¿ƒè½¬å‚¨ [kzpchkc()+4425] [SIGSEGV] [ADDR:0x34] [PC:0x92C0E13] [Address not mapped to object] []
Incident details in: /u01/diag/rdbms/wilson/wilson/incident/incdir_12215/wilson_ora_3619_i12215.trc
Sat Jun 23 06:53:40 2012
Trace dumping is performing id=[cdmp_20120623065340]
Sat Jun 23 06:53:45 2012
Sweep [inc][12215]: completed
Sweep [inc2][12215]: completed
Sat Jun 23 06:55:23 2012
ORA-942 encountered when generating server alert SMG-4120
ORA-942 encountered when generating server alert SMG-4121
如此类型的错误信息,遍布在近几天错误日志中。但执行一些失败的命令时(如desc),还会有异常错误信息在日志中展现。
在上面的错误日志中,还有是关于MMON进程异常中断之后,反复重新启动。
MMON进程是AWR报告库收集进程,定期(每小时)收集系统状态保存在数据库字典中。MMON异常中断后反复重启,似乎意味着AWR收集受到影响。
和朋友联系,获取进一步信息。
当日的AWR snapshot只有两条,看来真正出现了问题。同时,发现自动作业中的sys.standard包失效(invalid),合并的还有很多包和方法失效。
经过朋友回忆,应该是执行了exp/imp的重置脚本catexp.sql。看来是该脚本在执行中,破坏了内部的字典信息和数据,导致了一系列问题。
2、问题解决准备
发现了问题的根源,我们就可以有解决问题的基本思路:重新创建数据字典视图和程序对象。我们在Oracle程序安装目录中,均有保存建库脚本和程序,所以可以调用对应脚本,来更新数据字典和程序对象。
由于处理信息比较敏感,所以在处理之前,要进行一次完全备份。笔者选择停机冷备的方法。
首先,定位控制文件和数据文件位置信息,准备拷贝。
[root@bsplinux /]# chown -R oracle:oinstall backup
[root@bsplinux /]# ls -l | grep backup
drwxr-xr-x 2 oracle oinstall 4096 Jun 25 20:23 backup
--控制文件
SQL> select 'cp '||name||' /backup' from v$controlfile;
'CP'||NAME||'/BACKUP'
--------------------------------------------------------------------------------
cp /u01/app/oradata/ORA11G/controlfile/o1_mf_7vpyvypo_.ctl /backup
cp /u01/app/flash_recovery_area/ORA11G/controlfile/o1_mf_7vpyw16z_.ctl /backup
--数据文件
SQL> select 'cp '||file_name||' /backup' from dba_data_files;
'CP'||FILE_NAME||'/BACKUP'
--------------------------------------------------------------------------------
cp /u01/app/oradata/ORA11G/datafile/o1_mf_users_7vpyc2xd_.dbf /backup
cp /u01/app/oradata/ORA11G/datafile/o1_mf_undotbs1_7vpyc2py_.dbf /backup
cp /u01/app/oradata/ORA11G/datafile/o1_mf_sysaux_7vpyc2hb_.dbf /backup
cp /u01/app/oradata/ORA11G/datafile/o1_mf_system_7vpyc1x7_.dbf /backup
之后,关机将文件拷贝到备份目录上。
[oracle@bsplinux ~]$ sqlplus /nolog
SQL*Plus: Release 11.2.0.1.0 Production on Mon Jun 25 20:42:06 2012
Copyright (c) 1982, 2009, Oracle. All rights reserved.
SQL> conn / as sysdba
Connected.
SQL> shutdown immediate
Database closed.
Database dismounted.
ORACLE instance shut down.
SQL>
使用生成脚本语句,实现拷贝。
[oracle@bsplinux backup]$ ls -l
total 1720628
-rw-r----- 1 oracle oinstall 9748480 Jun 25 20:44 o1_mf_7vpyvypo_.ctl
-rw-r----- 1 oracle oinstall 9748480 Jun 25 20:44 o1_mf_7vpyw16z_.ctl
-rw-r----- 1 oracle oinstall 723525632 Jun 25 20:55 o1_mf_sysaux_7vpyc2hb_.dbf
-rw-r----- 1 oracle oinstall 744497152 Jun 25 21:08 o1_mf_system_7vpyc1x7_.dbf
-rw-r----- 1 oracle oinstall 267395072 Jun 25 20:47 o1_mf_undotbs1_7vpyc2py_.dbf
-rw-r----- 1 oracle oinstall 5251072 Jun 25 20:45 o1_mf_users_7vpyc2xd_.dbf
冷备份完成。
注意:在进行所有的修复操作前,如果有可能,一定要进行数据现场保留备份!这样起码可以做到不会将情况恶化。
3、恢复元数据信息
下面就可以执行相关的脚本,来恢复数据对象。首先,需要将数据库启动到upgrade模式。
SQL> conn / as sysdba
Connected to an idle instance.
SQL> startup upgrade
ORACLE instance started.
Total System Global Area 422670336 bytes
Fixed Size 1336960 bytes
Variable Size 318769536 bytes
Database Buffers 96468992 bytes
Redo Buffers 6094848 bytes
Database mounted.
Database opened.
SQL>
数据字典和基础程序相关的是三个程序脚本,按照顺序分别执行。
SQL> spool res.log
SQL> @?/rdbms/admin/catalog.sql
SQL> @?/rdbms/admin/catproc.sql
SQL> @?/rdbms/admin/utlrp.sql
三个程序的作用是:catalog.sql负责创建基础数据视图对象,catproc.sql负责创建基础程序包,而utlrp.sql负责将相关的程序进行编译处理。
完成之后,如果没有明显的错误,就可以重新启动系统。
SQL> shutdown immediate
Database closed.
Database dismounted.
ORACLE instance shut down.
SQL> startup
ORACLE instance started.
Total System Global Area 422670336 bytes
Fixed Size 1336960 bytes
Variable Size 327158144 bytes
Database Buffers 88080384 bytes
Redo Buffers 6094848 bytes
Database mounted.
Database opened.
SQL>
4、总结
在进行处理的时候,有一个重要问题需要注意。我们执行的脚本,一定是服务器端上的Oracle程序目录对应的脚本文件,而不是客户端对应的脚本文件。因为版本的原因,我们往往客户端版本与服务器不匹配。特别是程序脚本,如果存在版本差异,甚至会引起更大规模的错误故障。
来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/17203031/viewspace-733776/,如需转载,请注明出处,否则将追究法律责任。
转载于:http://blog.itpub.net/17203031/viewspace-733776/