oracle rac 日志体系结构

最新推荐文章于 2024-08-06 07:35:25 发布

南京-亮亮

最新推荐文章于 2024-08-06 07:35:25 发布

阅读量1.5k

点赞数

分类专栏： ORACLE

ORACLE 专栏收录该内容

16 篇文章 0 订阅

订阅专栏

告警日志
集群节点集群件告警日志：$GRID_HOME/log/<hostname>/alert<hostname>.log

数据库实例的告警日志：$DIAG_DESTINATION/rdbms/<dbname>/SID/trace/alert_<SID>.log

安装日志文件
root.sh配置脚本的调试日志：$GRID_HOME/cfgtoollogs/crsconfig/rootcrs_<hostname>.log

自动诊断仓库
自动诊断仓库位置由初始化参数diagnostic_dest指定，和操作系统环境变量$ORACLE_BASE一样。
如果diagnostic_dest和$ORACLE_BASE都未设置，则使用$ORACLE_HOME/log路径。

[sql]view plaincopyprint? 
   
 SQL> select * from v$diag_info;  
   
    INST_ID NAME                           VALUE  
 ---------- ------------------------------ ------------------------------------------------------------  
          2 Diag Enabled                   TRUE  
          2 ADR Base                       /u01/app  
          2 ADR Home                       /u01/app/diag/rdbms/orcl/orcl2  
          2 Diag Trace                     /u01/app/diag/rdbms/orcl/orcl2/trace  
          2 Diag Alert                     /u01/app/diag/rdbms/orcl/orcl2/alert  
          2 Diag Incident                  /u01/app/diag/rdbms/orcl/orcl2/incident  
          2 Diag Cdump                     /u01/app/diag/rdbms/orcl/orcl2/cdump  
          2 Health Monitor                 /u01/app/diag/rdbms/orcl/orcl2/hm  
          2 Default Trace File             /u01/app/diag/rdbms/orcl/orcl2/trace/orcl2_ora_15431.trc  
          2 Active Problem Count           0  
          2 Active Incident Count          0  
   
 已选择11行。  

cdump：这个目录包含核心转储
trace：这个目录转储数据库告警日志和前台及后台数据库进程的跟踪文件。
alert：这个目录存储XML告警日志。
hm：这个目录存储健康检查输出文件。
incident：这个目录存储由关键错误生成的事故目录，每个事故目录以该事故的ID进行命名。
metadata：这个目录包含诊断元数据。

oracle gridinfrastructure日志目录结构
$GRID_HOME/log 这是每个集群节点上为oracle集群件以及ASM存储跟踪和诊断日志文件的主目录。
$GRID_HOME/log/<hostname> 仅包含本地节点上oracle集群件和ASM的跟踪和诊断日志文件。
$GRID_HOME/log/<hostname>/agent 包含CRSD和OHASD守护进程的跟踪和诊断日志文件。

$GRID_HOME/log/<hostname>/crsd 包含CRSD守护进程的跟踪和调试日志。

$GRID_HOME/log/<hostname>/ohasd 包含高可用性守护进程的跟踪和调试日志。

$GRID_HOME/log/<hostname>/cssd 包含CSS日志，其中包括来自客户端CSS侦听器的操作。
$GRID_HOME/log/<hostname>/diskmon 包含用于排除磁盘监控器守护进程故障的跟踪和调试日志。
$GRID_HOME/log/<hostname>/gipcd 包含用于排除oracle网格进程间通信守护进程的跟踪和调试日志。

$GRID_HOME/log/<hostname>/gnsd 包含用户排除oracle网格命令服务相关问题的跟踪和诊断日志文件。
$GRID_HOME/log/<hostname>/crflogd 包含由oracle集群健康监控器提供的集群记录服务器服务记录的跟踪和调试日志.

$GRID_HOME/log/<hostname>/ctssd 包含用户排除集群时间同步服务故障的跟踪和调试日志。
$GRID_HOME/log/<hostname>/client 包含各种oracle gridinfrastructure客户端的跟踪和诊断日志文件。
$GRID_HOME/log/<hostname>/crfmond 包含由oracle集群健康监控器提供的系统监控服务记录的跟踪和诊断日志文件。
$GRID_HOME/log/<hostname>/cvu 包含由oracle集群验证实用工具生成的跟踪和诊断日志文件。
$GRID_HOME/log/<hostname>/evmd 包含EVM守护进程的跟踪和诊断日志文件。

$GRID_HOME/log/<hostname>/mdnsd 包含用于排除多播域名服务故障的跟踪和诊断日志文件。
$GRID_HOME/log/<hostname>/racg 包含各个oracle racg可执行文件的跟踪和调试日志。。
$GRID_HOME/log/<hostname>/gpnpd 包含网格即插即用守护进程的跟踪和调试日志。

CRSD进程	10g RAC， CRSD是RAC中最关键的进程之一，Oracle在操作系统启动后，就是通过启动这个进程然后启动整个CLUSTER以及数据库的。在11.2的RAC中，Oracle调整了ASM，使得OCR和VOT可以存储在ASM磁盘组中。ASM是CLUSTER所支持的一个组件，而CLUSTER启动所需的OCR和VOT却要放在ASM中，这其实要解决一个先有鸡还是先有蛋的问题。最终Oracle通过OHASD进程的方式解决了这个问题，而整个CLUSTER和ASM的架构也发生了重大的变化，OHASD进程取代了CRSD进程变成了RAC环境中最关键的进程。而CRSD进程的重要性已经低到难以置信的地步， 11.2 RAC环境中发现，即使一个节点的CRSD进程没有启动，仍然可以手工启动数据库，且数据库可以正常访问。导致的问题原因应该是节点2上访问OCR和VOT所在的磁盘组出现了错误，导致CRSD在多次尝试获取OCR中存储的信息失败后自动退出，从而使得节点2无法正常的启动。不过这时节点2上除了CRSD进程外，其他的CLUSTER进程已经完全启动，ASM实例也可以启动，这时可以手工启动节点2上的数据库。 CRSD是实现"高可用性(HA)"的主要进程，它提供的服务叫作CRS(Cluster Ready Service) 服务。所有需要高可用性的组件，都会在安装配置的时候，以CRS Resource的形式登记到OCR中，而CRSD 进程就是根据OCR中的内容，决定监控哪些进程，如何监控，出现问题时又如何解决。也就是说，CRSD 进程负责监控CRS Resource 的运行状态，并要启动，停止，监控，Failover这些资源。默认情况下，CRS 会自动尝试重启资源5次，如果还是失败，则放弃尝试。 CRS Resource 包括GSD(Global Serveice Daemon),ONS(Oracle Notification Service),VIP, Database, Instance 和Service.
OHASD进程	Oracle High Availability Services Daemon (OHASD) ：This process anchors the lower part of the Oracle Clusterware stack, which consists of processes that facilitate cluster operations. 在11gR2里面启动CRS的时候，会提示ohasd已经启动。那么这个OHASD到底包含哪些资源。我们可以通过如下命令来查看. crsctl stat res -init -t
OCSSD进程	OCSSD ：这个进程是Clusterware最关键的进程，如果这个进程出现异常，会导致系统重启，这个进程提供CSS(Cluster Synchronization Service)服务。 CSS 服务通过多种心跳机制实时监控集群状态，提供脑裂保护等基础集群服务功能。
EVMD进程	负责发布CRS 产生的各种事件(Event). 这些Event可以通过2种方式发布给客户：ONS 和 Callout Script.