简单说明:
参见MOS文档 2225748.1,以下资料均从该文档摘录
启动流程概览图:
启动流程步骤层次梳理:
第一层:OHASD 启动:
- cssdagent - 负责启动 CSSD 的 Agent。
- orarootagent - 负责启动所有 root 用户下的 ohasd 资源 的Agent。
- oraagent - 负责启动所有 oracle 用户下的 ohasd 资源的 Agent。
- cssdmonitor - 监控 CSSD 以及节点健康(和 cssdagent 一起)。
第二层:OHASD rootagent 启动:
- CRSD - 管理集群资源的主要后台进程。
- CTSSD - Cluster Time Synchronization Services Daemon
- Diskmon
- ACFS (ASM Cluster File System)驱动
第二层:OHASD oraagent 启动:
- MDNSD - 用来实现 DNS 查询
- GIPCD - 用来做节点间通信
- GPNPD - Grid Plug & Play Profile Daemon
- EVMD - Event Monitor Daemon
- ASM - ASM 资源
第三层:CRSD 启动:
- orarootagent - 负责启动所有 root 用户下的 crsd 资源的 Agent。
- oraagent - 负责启动所有 oracle 用户下的 crsd 资源的 Agent。
第四层:CRSD rootagent 启动:
- Network resource - 监控公共网络
- SCAN VIP(s) - Single Client Access Name Virtual IPs
- Node VIPs - 每个节点1个
- ACFS Registery - 挂载 ASM Cluster File System
- GNS VIP (optional) - VIP for GNS
第四层:CRSD oraagent 启动:
- ASM Resouce - ASM 资源
- Diskgroup - 用来管理/监控 ASM 磁盘组
- DB Resource - 用来管理/监控数据库和实例
- SCAN Listener - SCAN 监听,监听在 SCAN VIP 上
- Listener - 节点监听,监听在 Node VIP 上
- Services - 用来管理/监控 services
- ONS - Oracle Notification Service
- eONS - 加强版 Oracle Notification Service
- GSD - 为了向下兼容 9i
- GNS (optional) - Grid Naming Service - 处理域名解析
启动流程对应日志:
Clusterware 后台进程日志都放在”GRID_HOME”/log/”NODENAME”之下,结构如下:
/<GRID_HOME>/log/<NODENAME>/alert<NODENAME>.log
对于clusterware的问题,先检查这个文件
/<GRID_HOME>/log/<NODENAME>/ohasd
/<GRID_HOME>/log/<NODENAME>/agent/ohasd/oraagent_<GRIDUSER>
/<GRID_HOME>/log/<NODENAME>/agent/ohasd/oracssdagent_root
/<GRID_HOME>/log/<NODENAME>/agent/ohasd/oracssdmonitor_root
/<GRID_HOME>/log/<NODENAME>/agent/ohasd/orarootagent_root
对应的 OHASD进程和其启动的子进程日志和PID
/<GRID_HOME>/log/<NODENAME>/crsd
/<GRID_HOME>/log/<NODENAME>/ctssd
/<GRID_HOME>/log/<NODENAME>/diskmon
对应 OHASD rootagent 启动的CRSD、CTSSD和Diskmon
/<GRID_HOME>/log/<NODENAME>/mdnsd
/<GRID_HOME>/log/<NODENAME>/gipcd
/<GRID_HOME>/log/<NODENAME>/gpnpd
/<GRID_HOME>/log/<NODENAME>/evmd
对应 OHASD oraagent 启动的MDNSD、GIPCD、GPNPD和EVMD
/<GRID_HOME>/log/<NODENAME>/agent/crsd/orarootagent_root
/<GRID_HOME>/log/<NODENAME>/agent/crsd/oraagent_<ORACLEUSER>
对应 CRSD 启动的orarootagent和oraagent
/<GRID_HOME>/log/<NODENAME>/cssd
对应 OHASD cssdagent 启动的CSSD
<GRID_HOME> 和 $ORACLE_BASE 目录下的 cfgtoollogs 目录存放了一些其它的重要日志
比如 rootcrs.pl 以及其它配置工具,比如 ASMCA 等等
ASM 日志存放在 $ORACLE_BASE/diag/asm/+asm/<ASM Instance Name>/trace
<GRID_HOME>/bin 目录下的 diagcollection.pl 可以自动收集重要的日志
以 root 用户执行它
Clusterware 资源状态检查:
使用root用户检查状态
su -
cd "$(su - grid -c 'echo $ORACLE_HOME')/bin"
./crsctl status resource -t
或者直接使用grid用户检查状态
su - grid
crsctl status resource -t
集群资源管理和维护命令简介:
srvctl 和 crsctl 可以用来管理集群资源
尽量使用 srvctl 来管理资源,当srvctl无法操作时,使用crsctl管理资源
使用俩命令的-h参数列出所有的可用操作选项
ocrconfig 可以用来管理维护OCR(Oracle Cluster Registry)或OLR(Oracle Local Registry)
诸如导入导出升级、基于备份的恢复和备份策略等
olsnodes 可以用来管理维护集群的节点信息,如查看集群信息、节点状态等
cluvfy 集群相关状态的检查和维护命令,该命令可以用来对集群状态进行巡检
主要有 comp 和 stage 两类用法
查看相应的帮助:cluvfy comp -help、cluvfy stage -help
可以实现诸如节点探测、共享存储可用性探测、集群安装前的系统或硬件检查等
[TOC]