Oracle11g RAC 启动流程梳理(一)概览

简单说明:

参见MOS文档 2225748.1,以下资料均从该文档摘录

启动流程概览图:

这里写图片描述

启动流程步骤层次梳理:

第一层:OHASD 启动:

  • cssdagent - 负责启动 CSSD 的 Agent。
  • orarootagent - 负责启动所有 root 用户下的 ohasd 资源 的Agent。
  • oraagent - 负责启动所有 oracle 用户下的 ohasd 资源的 Agent。
  • cssdmonitor - 监控 CSSD 以及节点健康(和 cssdagent 一起)。

第二层:OHASD rootagent 启动:

  • CRSD - 管理集群资源的主要后台进程。
  • CTSSD - Cluster Time Synchronization Services Daemon
  • Diskmon
  • ACFS (ASM Cluster File System)驱动

第二层:OHASD oraagent 启动:

  • MDNSD - 用来实现 DNS 查询
  • GIPCD - 用来做节点间通信
  • GPNPD - Grid Plug & Play Profile Daemon
  • EVMD - Event Monitor Daemon
  • ASM - ASM 资源

第三层:CRSD 启动:

  • orarootagent - 负责启动所有 root 用户下的 crsd 资源的 Agent。
  • oraagent - 负责启动所有 oracle 用户下的 crsd 资源的 Agent。

第四层:CRSD rootagent 启动:

  • Network resource - 监控公共网络
  • SCAN VIP(s) - Single Client Access Name Virtual IPs
  • Node VIPs - 每个节点1个
  • ACFS Registery - 挂载 ASM Cluster File System
  • GNS VIP (optional) - VIP for GNS

第四层:CRSD oraagent 启动:

  • ASM Resouce - ASM 资源
  • Diskgroup - 用来管理/监控 ASM 磁盘组
  • DB Resource - 用来管理/监控数据库和实例
  • SCAN Listener - SCAN 监听,监听在 SCAN VIP 上
  • Listener - 节点监听,监听在 Node VIP 上
  • Services - 用来管理/监控 services
  • ONS - Oracle Notification Service
  • eONS - 加强版 Oracle Notification Service
  • GSD - 为了向下兼容 9i
  • GNS (optional) - Grid Naming Service - 处理域名解析

启动流程对应日志:

Clusterware 后台进程日志都放在”GRID_HOME”/log/”NODENAME”之下,结构如下:

/<GRID_HOME>/log/<NODENAME>/alert<NODENAME>.log
    对于clusterware的问题,先检查这个文件

/<GRID_HOME>/log/<NODENAME>/ohasd
/<GRID_HOME>/log/<NODENAME>/agent/ohasd/oraagent_<GRIDUSER>
/<GRID_HOME>/log/<NODENAME>/agent/ohasd/oracssdagent_root
/<GRID_HOME>/log/<NODENAME>/agent/ohasd/oracssdmonitor_root
/<GRID_HOME>/log/<NODENAME>/agent/ohasd/orarootagent_root
    对应的 OHASD进程和其启动的子进程日志和PID

/<GRID_HOME>/log/<NODENAME>/crsd
/<GRID_HOME>/log/<NODENAME>/ctssd
/<GRID_HOME>/log/<NODENAME>/diskmon
    对应 OHASD rootagent 启动的CRSD、CTSSD和Diskmon

/<GRID_HOME>/log/<NODENAME>/mdnsd
/<GRID_HOME>/log/<NODENAME>/gipcd
/<GRID_HOME>/log/<NODENAME>/gpnpd
/<GRID_HOME>/log/<NODENAME>/evmd
    对应 OHASD oraagent 启动的MDNSD、GIPCD、GPNPD和EVMD

/<GRID_HOME>/log/<NODENAME>/agent/crsd/orarootagent_root
/<GRID_HOME>/log/<NODENAME>/agent/crsd/oraagent_<ORACLEUSER>
    对应 CRSD 启动的orarootagent和oraagent

/<GRID_HOME>/log/<NODENAME>/cssd
    对应 OHASD cssdagent 启动的CSSD

<GRID_HOME> 和 $ORACLE_BASE 目录下的 cfgtoollogs 目录存放了一些其它的重要日志
比如 rootcrs.pl 以及其它配置工具,比如 ASMCA 等等

ASM 日志存放在 $ORACLE_BASE/diag/asm/+asm/<ASM Instance Name>/trace

<GRID_HOME>/bin 目录下的 diagcollection.pl 可以自动收集重要的日志
以 root 用户执行它

Clusterware 资源状态检查:

使用root用户检查状态

su -
cd "$(su - grid -c 'echo $ORACLE_HOME')/bin"
./crsctl status resource -t

或者直接使用grid用户检查状态

su - grid
crsctl status resource -t

集群资源管理和维护命令简介:

srvctl 和 crsctl 可以用来管理集群资源
尽量使用 srvctl 来管理资源,当srvctl无法操作时,使用crsctl管理资源
使用俩命令的-h参数列出所有的可用操作选项

ocrconfig 可以用来管理维护OCR(Oracle Cluster Registry)或OLR(Oracle Local Registry)
诸如导入导出升级、基于备份的恢复和备份策略等

olsnodes 可以用来管理维护集群的节点信息,如查看集群信息、节点状态等

cluvfy 集群相关状态的检查和维护命令,该命令可以用来对集群状态进行巡检
主要有 comp 和 stage 两类用法
查看相应的帮助:cluvfy comp -help、cluvfy stage -help
可以实现诸如节点探测、共享存储可用性探测、集群安装前的系统或硬件检查等

[TOC]

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值