ADRCI是在Oracle11g以后提供的实用程序,用来更加灵活的检查和分析各个ORACLE_HOME的告警文件,跟踪文件。

根据文档和帮助,ADRCI是具有purge功能的。

adrci> help purge    Usage: PURGE [[-i <id1> | <id1> <id2>] |               [-age <mins> [-type ALERT|INCIDENT|TRACE|CDUMP|HM|UTSCDMP]]]:    Purpose: Purge the diagnostic data in the current ADR home. If no           option is specified, the default purging policy will be used.    Options:    [-i id1 | id1 id2]: Users can input a single incident ID, or a    range of incidents to purge.      [-age <mins>]: Users can specify the purging policy either to all    the diagnostic data or the specified type. The data older than <mins>    ago will be purged      [-type ALERT|INCIDENT|TRACE|CDUMP|HM|UTSCDMP]: Users can specify what type of    data to be purged.    Examples:    purge    purge -i 123 456    purge -age 60 -type incident

仅仅看这个帮助,我们认为的ADRCI Purge功能是怎样的呢?比如我们执行了下面这个命令,那么Oracle应该将我们的告警日志中在距现在这个时刻1440分钟(也就是1天)以前的所有日志内容删除,是这样吧?可是确实是这样吗?

adrci> PURGE -age 1440 -type ALERT

我们测试一下。

adrci> show home ADR Homes:  diag/rdbms/orcl/orcl diag/tnslsnr/dbserver/listener adrci> set home diag/rdbms/orcl/orcl adrci> show alert -tail 2010-05-02 20:04:56.447000 +08:00 Verifying file header compatibility for 11g tablespace encryption.. Verifying 11g file header compatibility for tablespace encryption completed SMON: enabling tx recovery Database Characterset is AL32UTF8 No Resource Manager plan active 2010-05-02 20:04:58.182000 +08:00 replication_dependency_tracking turned off (no async multimaster replication found) 2010-05-02 20:04:59.607000 +08:00 Starting background process QMNC QMNC started with pid=18, OS id=1405  2010-05-02 20:05:00.653000 +08:00 Completed: ALTER DATABASE OPEN 2010-05-02 20:05:07.033000 +08:00 Starting background process CJQ0 CJQ0 started with pid=19, OS id=1426  2010-05-02 20:10:00.609000 +08:00 Starting background process SMCO SMCO started with pid=20, OS id=1587  2010-05-02 20:11:47.241000 +08:00 Thread 1 advanced to log sequence 16 (LGWR switch)  Current log# 1 seq# 16 mem# 0: /app/oracle/oradata/orcl/redo01.log

现在告警日志中存在的某两次记录时间是2010-05-02 20:04:56和2010-05-02 20:11:47。我们准备删除掉20:04前后的告警信息,保留20:11的。

[oracle@dbserver alert]$ date Sun May  2 20:14:20 CST 2010 [oracle@dbserver alert]$ pwd /app/oracle/diag/rdbms/orcl/orcl/alert [oracle@dbserver alert]$ ls -l total 24 -rw-r----- 1 oracle dba 20925 May  2 20:11 log.xml

当前的时间是2010-05-02 20:14。检查了Oracle11g中告警日志的默认存储位置,最后的一次更新时间是20:11。

[oracle@dbserver alert]$ date Sun May  2 20:15:51 CST 2010   adrci> PURGE -age 5 -type ALERT adrci> show alert -tail 2010-05-02 20:04:56.447000 +08:00 Verifying file header compatibility for 11g tablespace encryption.. Verifying 11g file header compatibility for tablespace encryption completed SMON: enabling tx recovery Database Characterset is AL32UTF8 No Resource Manager plan active 2010-05-02 20:04:58.182000 +08:00 replication_dependency_tracking turned off (no async multimaster replication found) 2010-05-02 20:04:59.607000 +08:00 Starting background process QMNC QMNC started with pid=18, OS id=1405  2010-05-02 20:05:00.653000 +08:00 Completed: ALTER DATABASE OPEN 2010-05-02 20:05:07.033000 +08:00 Starting background process CJQ0 CJQ0 started with pid=19, OS id=1426  2010-05-02 20:10:00.609000 +08:00 Starting background process SMCO SMCO started with pid=20, OS id=1587  2010-05-02 20:11:47.241000 +08:00 Thread 1 advanced to log sequence 16 (LGWR switch)  Current log# 1 seq# 16 mem# 0: /app/oracle/oradata/orcl/redo01.log   [oracle@dbserver alert]$ ls -l total 24 -rw-r----- 1 oracle dba 20925 May  2 20:11 log.xml

我们执行的命令成功了,但是很明显我们希望的目的没有达到,实际上,就好似没有执行这条命令一样,我们想要删除5分钟以前的内容,执行purge命 令的时刻是20:15,那么理应在20:10之前的告警日志内容都被删除掉,但是实际上告警日志中20:04的内容依然还在,并且我们也可以看出 log.xml文件的最后更新时间仍然是20:11。

那么purge命令到底有没有效果呢?

[oracle@dbserver alert]$ date Sun May  2 20:28:34 CST 2010   adrci> PURGE -age 5 -type ALERT adrci> show alert -tail adrci>    [oracle@dbserver alert]$ ls -l total 0

在20:28的时候我们再次执行了purge命令,仍然是尝试删除5分钟以前的内容,这次的结果是所有的告警日志内容都被清空了,告警日志文件 log.xml也被删除了。这条命令实际上有效果的,但是为什么不是我们期望的那样灵敏呢?为什么第一次没有成功,而第二次却成功了呢?

原因在于,ADRCI  Purge命令的操作单元是文件而不是文件内容,只有整个文件的最后更新时间在我们指定的purge命令条件之前,该文件才会被删除,也就是说,要不整个 文件都删除,要不一点儿也不删除。对于我们后一次执行的命令,因为文件的最后更新时间是20:11,这个时间点在我们执行purge命令时间点的5分钟以 前,因此整个告警日志都被删除。而对于我们第一次执行的命令,因为告警日志中不但包含了执行purge命令时间点5分钟之前的内容,还包括了5分钟之前到 执行purge命令时间点之间的内容(20:11的内容位于20:10和20:15之间),因此文件无法被删除。

无论是purge的什么TYPE,或者说purge -i 命令也同样是这样,对于INCIDENT来说,每个Incident ID在INCIDENT目录中都是一个子目录,因此很容易做到整个子目录的删除。

不得不说这样的purge命令并不是我们期望的,我也希望看到在今后的版本升级中ADRCI Purge可以变得如我们一开始期望的那样,直接删除符合条件的文件内容,而不是现在这样删除文件。

我们可以预见到对于特别繁忙的系统,假设每分钟都有告警日志内容生成,那么我们始终不可能执行成功purge,我们只能使用purge -age 0 -type ALERT这样的命令来清除所有的log内容。那么现在这样的purge命令我们该如何精确使用呢?

实际上仍然需要另外的客户化脚本,比如在crontab中定义每天晚上的某个时刻将现在的log.xml文件更名为log_`date`.xml, 然后统一使用purge命令删除符合条件的告警日志文件备份。特别需要注意的是,更名规则要符合purge命令的检查规范,purge命令只会对相应目录 中以log开头以xml结尾的文件进行检查。

PS:purge命令只会清除xml文件,对于trace目录中的和Oracle11g之前版本兼容的alert_.log文件并不会有任何改动。

[oracle@dbserver trace]$ pwd /app/oracle/diag/rdbms/orcl/orcl/trace [oracle@dbserver trace]$ ls -l alert* -rw-r----- 1 oracle dba 41444 May  2 20:20 alert_orcl.log

转自: http://www.dbform.com/html/tag/adrci