集群节点集群件告警日志:$GRID_HOME/log/<hostname>/alert<hostname>.log
数据库实例的告警日志:$DIAG_DESTINATION/rdbms/<dbname>/SID/trace/alert_<SID>.log
安装日志文件
root.sh配置脚本的调试日志:$GRID_HOME/cfgtoollogs/crsconfig/rootcrs_<hostname>.log
自动诊断仓库
自动诊断仓库位置由初始化参数diagnostic_dest指定,和操作系统环境变量$ORACLE_BASE一样。
如果diagnostic_dest和$ORACLE_BASE都未设置,则使用$ORACLE_HOME/log路径。
- SQL> select * from v$diag_info;
- INST_ID NAME VALUE
- ---------- ------------------------------ ------------------------------------------------------------
- 2 Diag Enabled TRUE
- 2 ADR Base /u01/app
- 2 ADR Home /u01/app/diag/rdbms/orcl/orcl2
- 2 Diag Trace /u01/app/diag/rdbms/orcl/orcl2/trace
- 2 Diag Alert /u01/app/diag/rdbms/orcl/orcl2/alert
- 2 Diag Incident /u01/app/diag/rdbms/orcl/orcl2/incident
- 2 Diag Cdump /u01/app/diag/rdbms/orcl/orcl2/cdump
- 2 Health Monitor /u01/app/diag/rdbms/orcl/orcl2/hm
- 2 Default Trace File /u01/app/diag/rdbms/orcl/orcl2/trace/orcl2_ora_15431.trc
- 2 Active Problem Count 0
- 2 Active Incident Count 0
- 已选择11行。
trace:这个目录转储数据库告警日志和前台及后台数据库进程的跟踪文件。
alert:这个目录存储XML告警日志。
hm:这个目录存储健康检查输出文件。
incident:这个目录存储由关键错误生成的事故目录,每个事故目录以该事故的ID进行命名。
metadata:这个目录包含诊断元数据。
oracle gridinfrastructure日志目录结构
$GRID_HOME/log 这是每个集群节点上为oracle集群件以及ASM存储跟踪和诊断日志文件的主目录。
$GRID_HOME/log/<hostname> 仅包含本地节点上oracle集群件和ASM的跟踪和诊断日志文件。
$GRID_HOME/log/<hostname>/agent 包含CRSD和OHASD守护进程的跟踪和诊断日志文件。
$GRID_HOME/log/<hostname>/crsd 包含CRSD守护进程的跟踪和调试日志。
$GRID_HOME/log/<hostname>/ohasd 包含高可用性守护进程的跟踪和调试日志。
$GRID_HOME/log/<hostname>/cssd 包含CSS日志,其中包括来自客户端CSS侦听器的操作。
$GRID_HOME/log/<hostname>/diskmon 包含用于排除磁盘监控器守护进程故障的跟踪和调试日志。
$GRID_HOME/log/<hostname>/gipcd 包含用于排除oracle网格进程间通信守护进程的跟踪和调试日志。
$GRID_HOME/log/<hostname>/gnsd 包含用户排除oracle网格命令服务相关问题的跟踪和诊断日志文件。
$GRID_HOME/log/<hostname>/crflogd 包含由oracle集群健康监控器提供的集群记录服务器服务记录的跟踪和调试日志.
$GRID_HOME/log/<hostname>/ctssd 包含用户排除集群时间同步服务故障的跟踪和调试日志。
$GRID_HOME/log/<hostname>/client 包含各种oracle gridinfrastructure客户端的跟踪和诊断日志文件。
$GRID_HOME/log/<hostname>/crfmond 包含由oracle集群健康监控器提供的系统监控服务记录的跟踪和诊断日志文件。
$GRID_HOME/log/<hostname>/cvu 包含由oracle集群验证实用工具生成的跟踪和诊断日志文件。
$GRID_HOME/log/<hostname>/evmd 包含EVM守护进程的跟踪和诊断日志文件。
$GRID_HOME/log/<hostname>/mdnsd 包含用于排除多播域名服务故障的跟踪和诊断日志文件。
$GRID_HOME/log/<hostname>/racg 包含各个oracle racg可执行文件的跟踪和调试日志。。
$GRID_HOME/log/<hostname>/gpnpd 包含网格即插即用守护进程的跟踪和调试日志。
CRSD进程 | 10g RAC, CRSD是RAC中最关键的进程之一,Oracle在操作系统启动后,就是通过启动这个进程然后启动整个CLUSTER以及数据库的。 在11.2的RAC中,Oracle调整了ASM,使得OCR和VOT可以存储在ASM磁盘组中。ASM是CLUSTER所支持的一个组件,而CLUSTER启动所需的OCR和VOT却要放在ASM中,这其实要解决一个先有鸡还是先有蛋的问题。最终Oracle通过OHASD进程的方式解决了这个问题,而整个CLUSTER和ASM的架构也发生了重大的变化,OHASD进程取代了CRSD进程变成了RAC环境中最关键的进程。 而CRSD进程的重要性已经低到难以置信的地步, 11.2 RAC环境中发现,即使一个节点的CRSD进程没有启动,仍然可以手工启动数据库,且数据库可以正常访问。 导致的问题原因应该是节点2上访问OCR和VOT所在的磁盘组出现了错误,导致CRSD在多次尝试获取OCR中存储的信息失败后自动退出,从而使得节点2无法正常的启动。不过这时节点2上除了CRSD进程外,其他的CLUSTER进程已经完全启动,ASM实例也可以启动,这时可以手工启动节点2上的数据库。 CRSD是实现"高可用性(HA)"的主要进程,它提供的服务叫作CRS(Cluster Ready Service) 服务。所有需要 高可用性 的组件,都会在安装配置的时候,以CRS Resource的形式登记到OCR中,而CRSD 进程就是根据OCR中的内容,决定监控哪些进程,如何监控,出现问题时又如何解决。也就是说,CRSD 进程负责监控CRS Resource 的运行状态,并要启动,停止,监控,Failover这些资源。 默认情况下,CRS 会自动尝试重启资源5次,如果还是失败,则放弃尝试。 CRS Resource 包括GSD(Global Serveice Daemon),ONS(Oracle Notification Service),VIP, Database, Instance 和Service. |
OHASD进程 | Oracle High Availability Services Daemon (OHASD) :This process anchors the lower part of the Oracle Clusterware stack, which consists of processes that facilitate cluster operations. 在11gR2里面启动CRS的时候,会提示ohasd已经启动。 那么这个OHASD到底包含哪些资源。 我们可以通过如下命令来查看. crsctl stat res -init -t |
OCSSD进程 | OCSSD :这个进程是Clusterware最关键的进程,如果这个进程出现异常,会导致系统重启,这个进程提供CSS(Cluster Synchronization Service)服务。 CSS 服务通过多种心跳机制实时监控集群状态,提供脑裂保护等基础集群服务功能。 |
EVMD进程 | 负责发布CRS 产生的各种事件(Event). 这些Event可以通过2种方式发布给客户:ONS 和 Callout Script. |