CRS 诊断数据收集:常见工具及其用法摘要 (Doc ID 1526158.1)

转载 2015年11月19日 12:24:18

适用于:

Oracle Database - Enterprise Edition - 版本 10.2.0.1 到 11.2.0.3 [发行版 10.2 到 11.2]
本文档所含信息适用于所有平台

用途

本文档提供了用于诊断 CRS/GRID 问题的工具的快速指南。

适用范围

本文档的目标受众是需要诊断 CRS/Grid Infrastructure 问题的 DBA,或者您希望事先监控集群,以确保在遇到 CRS 问题时,能够得到所需的从问题发生之后的诊断信息。

详细信息

为了充分利用问题调查工具,应在RAC 服务器所有节点上安装如下工具:

默认情况下,以下工具会在 CRS/Grid 安装时自动安装:


此外,如下工具也非常有用:

本文档提供了有关这些工具的功能和用法的简要概述。


远程诊断代理 [RDA]

此工具收集安装、配置、日志文件和性能数据。

有关如何下载和运行 RDA 的信息,请参阅 Document 314422.1 Remote Diagnostic Agent (RDA) 4 - Getting Started

要使用 RDA 中的自动化全节点收集功能,请参阅 Document 359395.1 Diagnostics Agent (RDA) for RAC Cluster

要运行 RDA:
将当前目录更改为安装目录。

如果 Perl 可用:
./rda.pl 

如果 Perl 不可用:
./rda.sh

如果访问 perl 时出现问题,则使用以下命令验证 Perl 已安装并可用:

perl -V 

检查命令输出,检查 “.”(即当前目录)是否在 @INC 部分中。

RDA 使用当前目录中的 setup.cfg 文件设置数据收集环境参数。如果一个服务器上有多个实例,则可能需要针对一个非安装时指定的实例运行 RDA。如果提供的 setup.cfg 文件不适用于当前数据库,则:

mv setup.cfg setup_copy_<date>.cfgbak 

./rda.pl 
or 
./rda.sh 
根据您的环境响应提示,以创建新的 setup.cfg 
运行 RDA 
恢复原始 setup.cfg(或验证更改是可接受的):


mv setup.cfg setup_$ORACLE_SID_<date>.cfgbak 
mv setup_copy_<date>.cfgbak setup.cfg

输出生成在安装步骤指定的目录中。输出目录将包括一个包含所有生成文件的 zip 文件。该文件就是应上载至服务请求的文件。


 

OS Watcher / Cluster Health Monitor

这些工具旨在收集 OS 性能统计信息。

OS Watcher (OSW)

OS Watcher (OSW) 是一组 UNIX shell 脚本的集合,主要用于收集和归档操作系统和网络的统计信息,以便为诊断性能问题提供支持。OSW 作为服务器上的一组后台进程运行,定期收集 OS 数据,调用 vmstat、netstat 和 iostat 等 Unix 实用程序。

更多详细信息,请参阅:
Document 301137.1 OS Watcher User Guide
Document 461053.1 OSWatcher Black Box Analyzer User Guide 
Document 433472.1 OS Watcher For Windows (OSWFW) User Guide.  

可以从 osw 安装目录中手动收集 OS Watcher 输出或压缩后的输出。  
可以从 osw 安装目录中手动启动数据收集:

nohup ./startOSW.sh 15 24 &

OS Watcher 应位于 init.d 中,以确保在服务器重新引导时自动启动。
tarupfiles.sh 脚本应当定期运行,以压缩 OS watcher 数据收集输出。应配置在 crontab 中。

Cluster Health Monitor (CHM)

在版本 11.2 中,Instantaneous Problem Detection OS Tool(IPD/OS)已经过修改并更名为 Cluster Health Monitor(CHM,集群健康监视器)。Cluster Health Monitor 收集 OS 统计信息(系统度量),如内存和交换空间的使用、进程、IO 的使用和网络相关的数据。Cluster Health Monitor 实时收集信息且通常每秒收集一次。Cluster Health Monitor 使用 OS API 收集 OS 统计信息,以提高性能并降低 CPU 的使用开销。Cluster Health Monitor 在本工具所消耗资源的可接受级别限制内,收集尽可能多的系统度量和数据。

有关 CHM 的更多信息,请参阅以下文章:

Document 1328466.1 Cluster Health Monitor (CHM) FAQ (Doc ID 1328466.1)
Document 811151.1 - How to install Oracle Cluster Health Monitor (former IPD/OS) on Windows


ProcWatcher

这是一个为 Oracle 进程收集堆栈跟踪信息的实用程序。对于 CRS 进程,必须以 root 用户身份运行,以拥有足够的权限监视 root 用户拥有的 CRS 进程。除非专门要求,否则使用以下文档中给出的步骤进行监视时不应包括 ocssd 进程。

Procwatcher 用户指南,请参阅:
Document 459694.1 Procwatcher: Script to Monitor and Examine Oracle and CRS Processes

启动 Procwatcher:

./prw.sh start 2

停止 Procwatcher:

./prw.sh stop

检查 Procwatcher 状态:

./prw.sh stat

 


diagcollection.pl: CRS 日志文件

CRS 10.2 及更高版本中提供了 diagcollection.pl 脚本。对于之前版本: Document 360926.1 提供了针对 RAC 版本 10.2 之前、10.2 及更高版本收集数据的详细信息。
CRS 日志可通过运行 $CRS_HOME/bin/diagcollection.pl 脚本(11.2 及更高版本中为 diagcollection.sh)收集。
要收集所有文件,diagcollection 必须以 root 用户身份运行。要成功运行 diagcollection,具体命令视版本而定。请参阅 Document 330358.1 了解每个版本的语法。

Unix/Linux 上的 10gR2 的 diagcollection.pl 命令示例:

export ORA_CRS_HOME=/u01/crs 
export ORACLE_BASE=/u01/app/oracle 
export HOSTNAME=racdb01 
$ORA_CRS_HOME/bin/diagcollection.pl -collect

Unix/Linux 上的 11gR1 的 diagcollection.pl 命令示例:

export ORA_CRS_HOME=/u01/crs 
$CRS_HOME/bin/diagcollection.pl -crshome $CRS_HOME --collect

Unix/Linux 上的 11gR2 的 diagcollection.pl 命令示例:

$GRID_HOME/bin/diagcollection.sh 
$GRID_HOME/bin/diagcollection.sh --adr /tmp/collect -beforetime 20120218100000 --aftertime 20120218050000
$GRID_HOME/bin/diagcollection.sh -chmos --incidenttime 02/18/201205:00:00 --incidentduration 05:00

Windows 上的 diagcollection.pl 命令示例:

set ORACLE_HOME=D:\oracle\ora102db 
set ORA_CRS_HOME=D:\oracle\ora102crs 
set ORACLE_BASE=D:\oracle 
%ORA_CRS_HOME%\bin\diagcollection.pl --collect

注意:在 Windows 中运行 diagcollection 前,可能需要添加 perl 至环境变量 PATH。

请查看 Document 330358.1 - CRS 10gR2/ 11gR1/ 11gR2 Diagnostic Collection Guide.

运行 diagcollection 将生成四个输出文件,包括配置和日志信息:
 crsData_<hostname>.tar.gz 
 ocrData_<hostname>.tar.gz 
 oraData_<hostname>.tar.gz 
 osData_<hostname>.tar.gz

 


Cluvfy 实用程序

CVU 是随 Oracle Clusterware 提供的实用程序。开发此程序是为了帮助安装和配置 Oracle Clusterware 和 RAC。CVU 将验证配置 RAC 环境不同阶段所需的所有重要组件。CVU 提供的验证范围很广,从 RAC 部署的初始硬件设置到已经正常运行的集群,涵盖各种组件的安装和配置的所有中间阶段。命令行工具为 cluvfy。Cluvfy 是非侵入式实用程序,且不会对系统或集群产生不利影响。

使用以下命令,验证已安装的 RAC 集群的配置:

cluvfy stage -post crsinst -n all -verbose

可以从 OTN 下载 cluvfy 的最新版本:
http://www.oracle.com/technology/products/database/clustering/cvu/cvu_download_homepage.html

请参阅 Document 316817.1 Cluster Verification Utility (CLUVFY) FAQ


 

通用附加数据收集

RACcheck - RAC 配置审核工具

RACcheck 是一款 RAC 配置审核工具,主要用于审核 Real Application Clusters (RAC)、Oracle Clusterware (CRS)、Automatic Storage Management (ASM) 和 Grid Infrastructure 环境中各个重要配置的设置。此工具审核以下类别配置的设置:

  1. OS 内核参数
  2. OS 软件包
  3. 其他许多对于 RAC 比较重要的 OS 配置设置。
  4. CRS/Grid Infrastructure
  5. RDBMS
  6. ASM
  7. 数据库初始化参数
  8. 其他对 RAC 非常重要的数据库配置
  9. 11.2.0.3 升级就绪评估

有关更多信息,请参阅 Document 1268927.1.

RAC 数据库跟踪文件

如果问题涉及数据库,请收集以下信息:

  • 收集问题出现期间在 $ORACLE_BASE/admin/$ORACLE_SID/bdump 中生成的所有跟踪文件,或数据库告警日志中提到的有关的所有跟踪文件。
  • 收集 $ORACLE_BASE/admin/$ORACLE_SID/udump 中生成的所有 SQL 跟踪输出

请参阅 Document 289690.1 Data Gathering for Troubleshooting Oracle Clusterware (CRS or GI) And Real Application Cluster (RAC) Issues 了解详细信息

CRS debug 设置

以下 debug 说明仅适用于 10.2 及以上版本。

1. srvctl 

要生成 srvctl 命令跟踪信息,应设置以下环境变量:

EXPORT SRVM_TRACE=TRUE

2. CRS/EVM/CSS 和 CRS 资源


请参阅 Document 357808.1 Diagnosability for Oracle Clusterware (CRS or Grid Infrastructure) Component and Resource 了解如何收集 CRS 组件的 debug 信息。

Oracle Universal Installer

请参阅 Document 784667.1 What are the debugging options in OUI?

系统消息文件位置:

各平台的系统日志位于以下特定位置:

  • Linux: /var/log/messages
  • Sun: /var/adm/messages
  • HP-UX: /var/adm/syslog/syslog.log
  • Tru64: /var/adm/messages
  • AIX: /bin/errpt -a
  • Windows: 使用事件查看器将应用程序日志和系统日志保存为 .TXT 文件,确保获取重启后的日志。

Veritas 日志文件位置:

  • /var/VRTSvcs/log/engine_A.log

REFERENCES

NOTE:330358.1 - CRS 10gR2/ 11gR1/ 11gR2 Diagnostic Collection Guide
NOTE:357808.1 - Diagnosability for Oracle Clusterware (CRS or Grid Infrastructure) Component and Resource
NOTE:359395.1 - Remote Diagnostic Agent (RDA) - RAC Cluster Guide
NOTE:433472.1 - OS Watcher For Windows (OSWFW) User Guide
NOTE:459694.1 - Procwatcher: Script to Monitor and Examine Oracle DB and Clusterware Processes
NOTE:784667.1 - What are the debugging options in OUI?
NOTE:135714.1 - Script to Collect RAC Diagnostic Information (racdiag.sql)
NOTE:1328466.1 - Cluster Health Monitor (CHM) FAQ
NOTE:289690.1 - Data Collecting for Troubleshooting Oracle Clusterware (CRS or GI) And Real Application Cluster (RAC) Issues
NOTE:811151.1 - How to Install Oracle Cluster Health Monitor (former IPD/OS) on Windows
NOTE:1268927.1 - RACcheck - RAC Configuration Audit Tool
NOTE:301137.1 - OSWatcher Black Box (Includes: [Video])
NOTE:316817.1 - Cluster Verification Utility (CLUVFY) FAQ
NOTE:314422.1 - Remote Diagnostic Agent (RDA) - Getting Started

CRS 诊断数据收集:常见工具及其用法摘要 (Doc ID 1526158.1)

适用于: Oracle Database - Enterprise Edition - 版本 10.2.0.1 到 11.2.0.3 [发行版 10.2 到 11.2] 本文档所含信息适用于所有平...
  • wangqingxun
  • wangqingxun
  • 2014年01月12日 08:23
  • 1782

clouder CDH 离线安装指南

louder CDH 离线安装指南 1 ClouderManager安装 1.1  什么是ClouderManager ? ClouderManager简单来说,是一套管理hadoop体系各个组...
  • tzwjava
  • tzwjava
  • 2014年10月11日 15:25
  • 1597

几个IIS诊断用的小工具,非常有用的说

Internet Information Service Diagnostics ToolkitIIS Diagnostics Toolkit每3个月更新一次,以保证IIS用户拥有最新版本的诊断工...
  • hejishan
  • hejishan
  • 2008年03月11日 14:25
  • 386

如何打开visual studio的诊断工具(diagnostic tool)

visual studio 2015打开诊断工具。其他版本我想也应该一样。 你为什么会问这个问题?因为它有个地方很坑人。 一、打开vs。debug(调试)/windows(窗口)/show d...
  • Dengdew
  • Dengdew
  • 2017年10月14日 11:24
  • 535

【Visual Studio】“诊断工具”窗口不支持当前的调试配置

无法使用诊断工具
  • qq_18995513
  • qq_18995513
  • 2017年03月06日 19:21
  • 1162

【总结】性能调优:JVM内存诊断工具

性能调优:消耗分析思维导图*号代表是重点工具。 这部分总结了内存诊断的相关工具。具体的工具使用,我会在这篇中增加子链接。...
  • superMarss
  • superMarss
  • 2015年04月27日 20:29
  • 1332

.net中查看那些函数吃CPU,使用vs自带的性能诊断工具

Q:为什么我的Visual Studio中没有代码分析功能([分析]菜单中[仅对...运行代码分析])。 A:你的vs版本是下面其中之一吗?    Microsoft Visual S...
  • tiz198183
  • tiz198183
  • 2017年09月27日 17:21
  • 160

luaDoc 试用心得

--- 继承于某table的属性及函数 -- @param selfclass 某table -- @param parentclass 需要继承的table -- @return 继承后的类 ...
  • lqk1985
  • lqk1985
  • 2010年09月16日 20:58
  • 1398

linux 性能诊断工具命令集

#查看当前系统load uptime #查看系统状态和每个进程的系统资源使用状况 top #可视化显示CPU的使用状况 htop #查看每个CPU的负载信息 mpstat -P ALL 1 #...
  • zhongweijian
  • zhongweijian
  • 2014年06月04日 11:50
  • 1363

Oracle Study之--Oracle 11gR2 RAC crs启动故障

Oracle Study之--Oracle 11gR2 RAC crs启动故障 系统环境:     操作系统:RedHat EL5     Cluster:  Oracl...
  • lqx0405
  • lqx0405
  • 2015年06月08日 16:51
  • 2147
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:CRS 诊断数据收集:常见工具及其用法摘要 (Doc ID 1526158.1)
举报原因:
原因补充:

(最多只允许输入30个字)