适用于:
Oracle Database - Enterprise Edition - 版本 10.2.0.1 到 11.2.0.3 [发行版 10.2 到 11.2]本文档所含信息适用于所有平台
用途
本文档提供了用于诊断 CRS/GRID 问题的工具的快速指南。
适用范围
本文档的目标受众是需要诊断 CRS/Grid Infrastructure 问题的 DBA,或者您希望事先监控集群,以确保在遇到 CRS 问题时,能够得到所需的从问题发生之后的诊断信息。
详细信息
为了充分利用问题调查工具,应在RAC 服务器所有节点上安装如下工具:
默认情况下,以下工具会在 CRS/Grid 安装时自动安装:
- diagcollection.pl (10gR2 及更高版本)
- Cluvfy utility
此外,如下工具也非常有用:
本文档提供了有关这些工具的功能和用法的简要概述。
远程诊断代理 [RDA]
此工具收集安装、配置、日志文件和性能数据。
有关如何下载和运行 RDA 的信息,请参阅 Document 314422.1 Remote Diagnostic Agent (RDA) 4 - Getting Started
要使用 RDA 中的自动化全节点收集功能,请参阅 Document 359395.1 Diagnostics Agent (RDA) for RAC Cluster
要运行 RDA:
将当前目录更改为安装目录。
./rda.pl
如果 Perl 不可用:
./rda.sh
如果访问 perl 时出现问题,则使用以下命令验证 Perl 已安装并可用:
检查命令输出,检查 “.”(即当前目录)是否在 @INC 部分中。
RDA 使用当前目录中的 setup.cfg 文件设置数据收集环境参数。如果一个服务器上有多个实例,则可能需要针对一个非安装时指定的实例运行 RDA。如果提供的 setup.cfg 文件不适用于当前数据库,则:
./rda.pl
or
./rda.sh
根据您的环境响应提示,以创建新的 setup.cfg
运行 RDA
恢复原始 setup.cfg(或验证更改是可接受的):
mv setup.cfg setup_$ORACLE_SID_<date>.cfgbak
mv setup_copy_<date>.cfgbak setup.cfg
输出生成在安装步骤指定的目录中。输出目录将包括一个包含所有生成文件的 zip 文件。该文件就是应上载至服务请求的文件。
OS Watcher / Cluster Health Monitor
这些工具旨在收集 OS 性能统计信息。
OS Watcher (OSW)
OS Watcher (OSW) 是一组 UNIX shell 脚本的集合,主要用于收集和归档操作系统和网络的统计信息,以便为诊断性能问题提供支持。OSW 作为服务器上的一组后台进程运行,定期收集 OS 数据,调用 vmstat、netstat 和 iostat 等 Unix 实用程序。
更多详细信息,请参阅:
Document 301137.1 OS Watcher User Guide
Document 461053.1 OSWatcher Black Box Analyzer User Guide
Document 433472.1 OS Watcher For Windows (OSWFW) User Guide.
可以从 osw 安装目录中手动收集 OS Watcher 输出或压缩后的输出。
可以从 osw 安装目录中手动启动数据收集:
OS Watcher 应位于 init.d 中,以确保在服务器重新引导时自动启动。
tarupfiles.sh 脚本应当定期运行,以压缩 OS watcher 数据收集输出。应配置在 crontab 中。
Cluster Health Monitor (CHM)
在版本 11.2 中,Instantaneous Problem Detection OS Tool(IPD/OS)已经过修改并更名为 Cluster Health Monitor(CHM,集群健康监视器)。Cluster Health Monitor 收集 OS 统计信息(系统度量),如内存和交换空间的使用、进程、IO 的使用和网络相关的数据。Cluster Health Monitor 实时收集信息且通常每秒收集一次。Cluster Health Monitor 使用 OS API 收集 OS 统计信息,以提高性能并降低 CPU 的使用开销。Cluster Health Monitor 在本工具所消耗资源的可接受级别限制内,收集尽可能多的系统度量和数据。
有关 CHM 的更多信息,请参阅以下文章:
Document 1328466.1 Cluster Health Monitor (CHM) FAQ (Doc ID 1328466.1)
Document 811151.1 - How to install Oracle Cluster Health Monitor (former IPD/OS) on Windows
ProcWatcher
这是一个为 Oracle 进程收集堆栈跟踪信息的实用程序。对于 CRS 进程,必须以 root 用户身份运行,以拥有足够的权限监视 root 用户拥有的 CRS 进程。除非专门要求,否则使用以下文档中给出的步骤进行监视时不应包括 ocssd 进程。
Procwatcher 用户指南,请参阅:
Document 459694.1 Procwatcher: Script to Monitor and Examine Oracle and CRS Processes
启动 Procwatcher:
停止 Procwatcher:
检查 Procwatcher 状态:
diagcollection.pl: CRS 日志文件
CRS 10.2 及更高版本中提供了 diagcollection.pl 脚本。对于之前版本: Document 360926.1 提供了针对 RAC 版本 10.2 之前、10.2 及更高版本收集数据的详细信息。
CRS 日志可通过运行 $CRS_HOME/bin/diagcollection.pl 脚本(11.2 及更高版本中为 diagcollection.sh)收集。
要收集所有文件,diagcollection 必须以 root 用户身份运行。要成功运行 diagcollection,具体命令视版本而定。请参阅 Document 330358.1 了解每个版本的语法。
Unix/Linux 上的 10gR2 的 diagcollection.pl 命令示例:
export ORACLE_BASE=/u01/app/oracle
export HOSTNAME=racdb01
$ORA_CRS_HOME/bin/diagcollection.pl -collect
Unix/Linux 上的 11gR1 的 diagcollection.pl 命令示例:
$CRS_HOME/bin/diagcollection.pl -crshome $CRS_HOME --collect
Unix/Linux 上的 11gR2 的 diagcollection.pl 命令示例:
$GRID_HOME/bin/diagcollection.sh --adr /tmp/collect -beforetime 20120218100000 --aftertime 20120218050000
$GRID_HOME/bin/diagcollection.sh -chmos --incidenttime 02/18/201205:00:00 --incidentduration 05:00
Windows 上的 diagcollection.pl 命令示例:
set ORA_CRS_HOME=D:\oracle\ora102crs
set ORACLE_BASE=D:\oracle
%ORA_CRS_HOME%\bin\diagcollection.pl --collect
注意:在 Windows 中运行 diagcollection 前,可能需要添加 perl 至环境变量 PATH。
请查看 Document 330358.1 - CRS 10gR2/ 11gR1/ 11gR2 Diagnostic Collection Guide.
运行 diagcollection 将生成四个输出文件,包括配置和日志信息:
crsData_<hostname>.tar.gz
ocrData_<hostname>.tar.gz
oraData_<hostname>.tar.gz
osData_<hostname>.tar.gz
Cluvfy 实用程序
CVU 是随 Oracle Clusterware 提供的实用程序。开发此程序是为了帮助安装和配置 Oracle Clusterware 和 RAC。CVU 将验证配置 RAC 环境不同阶段所需的所有重要组件。CVU 提供的验证范围很广,从 RAC 部署的初始硬件设置到已经正常运行的集群,涵盖各种组件的安装和配置的所有中间阶段。命令行工具为 cluvfy。Cluvfy 是非侵入式实用程序,且不会对系统或集群产生不利影响。
使用以下命令,验证已安装的 RAC 集群的配置:
可以从 OTN 下载 cluvfy 的最新版本:
http://www.oracle.com/technology/products/database/clustering/cvu/cvu_download_homepage.html
请参阅 Document 316817.1 Cluster Verification Utility (CLUVFY) FAQ
通用附加数据收集
RACcheck - RAC 配置审核工具
RACcheck 是一款 RAC 配置审核工具,主要用于审核 Real Application Clusters (RAC)、Oracle Clusterware (CRS)、Automatic Storage Management (ASM) 和 Grid Infrastructure 环境中各个重要配置的设置。此工具审核以下类别配置的设置:
- OS 内核参数
- OS 软件包
- 其他许多对于 RAC 比较重要的 OS 配置设置。
- CRS/Grid Infrastructure
- RDBMS
- ASM
- 数据库初始化参数
- 其他对 RAC 非常重要的数据库配置
- 11.2.0.3 升级就绪评估
有关更多信息,请参阅 Document 1268927.1.
RAC 数据库跟踪文件
如果问题涉及数据库,请收集以下信息:
- 收集问题出现期间在 $ORACLE_BASE/admin/$ORACLE_SID/bdump 中生成的所有跟踪文件,或数据库告警日志中提到的有关的所有跟踪文件。
- 收集 $ORACLE_BASE/admin/$ORACLE_SID/udump 中生成的所有 SQL 跟踪输出
请参阅 Document 289690.1 Data Gathering for Troubleshooting Oracle Clusterware (CRS or GI) And Real Application Cluster (RAC) Issues 了解详细信息
CRS debug 设置
1. srvctl
要生成 srvctl 命令跟踪信息,应设置以下环境变量:
2. CRS/EVM/CSS 和 CRS 资源
请参阅 Document 357808.1 Diagnosability for Oracle Clusterware (CRS or Grid Infrastructure) Component and Resource 了解如何收集 CRS 组件的 debug 信息。
Oracle Universal Installer
请参阅 Document 784667.1 What are the debugging options in OUI?
系统消息文件位置:
各平台的系统日志位于以下特定位置:
- Linux: /var/log/messages
- Sun: /var/adm/messages
- HP-UX: /var/adm/syslog/syslog.log
- Tru64: /var/adm/messages
- AIX: /bin/errpt -a
- Windows: 使用事件查看器将应用程序日志和系统日志保存为 .TXT 文件,确保获取重启后的日志。
Veritas 日志文件位置:
REFERENCES
NOTE:330358.1 - CRS 10gR2/ 11gR1/ 11gR2 Diagnostic Collection GuideNOTE:357808.1 - Diagnosability for Oracle Clusterware (CRS or Grid Infrastructure) Component and Resource
NOTE:359395.1 - Remote Diagnostic Agent (RDA) - RAC Cluster Guide
NOTE:433472.1 - OS Watcher For Windows (OSWFW) User Guide
NOTE:459694.1 - Procwatcher: Script to Monitor and Examine Oracle DB and Clusterware Processes
NOTE:784667.1 - What are the debugging options in OUI?
NOTE:135714.1 - Script to Collect RAC Diagnostic Information (racdiag.sql)
NOTE:1328466.1 - Cluster Health Monitor (CHM) FAQ
NOTE:289690.1 - Data Collecting for Troubleshooting Oracle Clusterware (CRS or GI) And Real Application Cluster (RAC) Issues
NOTE:811151.1 - How to Install Oracle Cluster Health Monitor (former IPD/OS) on Windows
NOTE:1268927.1 - RACcheck - RAC Configuration Audit Tool
NOTE:301137.1 - OSWatcher Black Box (Includes: [Video])
NOTE:316817.1 - Cluster Verification Utility (CLUVFY) FAQ
NOTE:314422.1 - Remote Diagnostic Agent (RDA) - Getting Started