层次结构图
Agent管理的进程图
资源介绍
1、Ohasd这个进程是由/etc/init.d/ohasd脚本启动的,这个脚本能接收start、stop两个参数。
2、Ohasd的oraagent是以grid用户身份运行的,由他维护的资源如下:
Ora.asm
ASM必须先于CRSD启动,这样CRSD才能访问ASM。因此ohasd负责启动、关闭、监视ASM实例。
Ora.evmd
EVM负责订阅集群环境事件的生成和发布,EVMD会产生一个叫evmlogger的子进程,再由这个进程产生更多的子进程。Evmlogger进程会根据$GRID_HOME/evm/admin/evmlogger.conf 配置文件产生日志,可以使用这个文件中的maxsize参数来控制日志文件的大小。EVMD的另一个功能就是调用用户的回调脚本,用户把这些脚本放到特定的RACG目录下,EVMD会扫描这个目录并负责调用这些脚本。EVMD是以grid用户运行的,在失败时会自动重启。日志位于$GRID_HOME/log/hostname/evmd/evmd.log
Ora.mdnsd
MDNS即multicast DNS,与GNSD合作来提供域名解析工作。
Ora.gpnpd
此进程负责集群节点间GPnP prifile 的同步,这个文件保存在每个节点的本地,位置是$GRID_HOME/gpnp/profile/peer/profile.xml,文件内容是这个节点加入集群所需要的必需信息。日志位于$GRID_HOME/log/hostname/gpnpd/gpnpd.log
Ora.gipcd
Oracle grid 11.2开始,oracle使用一个全新的代码完成集群的通信协议,叫做grid IPC以及grid inter process communitcation daemon(GIPCD)。Grid IPC支持多种通信协议类型,包括UDP、IPC、TCP及grid IPC本身。日志位于$GRID_HOME/log/hostname/gipcd/gipcd.log
3、ohasd的orarootagent
这个进程以root用户身份运行,负责ora.crsd/ora.crssd/ora.drivers.acfs/diskmon的启动、关闭和检查,这些进程也都是以root身份运行的。
Ora.crsd
这个daemon负责启动管理应用资源的agent。
Ora.ctssd
这个daemon负责处理时间同步。日志位于$GRID_HOME/log/hostname/ctssd/ctssd.log
Ora.diskmon
用来监控Exadata中的Cell Server,只有在Exadata环境中才有作用。Gird版本11.2.0.1和11.2.0.2中,即便在非Exadaata环境也默认启动该守护进程。到了版本11.2.0.3,改进了这一细节,非Exadata环境无法启动diskmon了。
Ora.drivers.acfs
这个进程负责ACFS驱动的加载,确保ACFS可用。这个进程的日志会写到系统日志及控制台中。
4、ohasd的cssdagent和cssdmonitor
Cssdagent负责cssd进程的启动、关闭和检查,而cssdmonitor监控cssdagent。这个两个进程和ocssd进程都运行在实时模式下,因为这个可以保证有效的调度,任何一点调度上的延迟都可能会被看做是进程的挂起,会导致节点被隔离。日志位置分别为$GRID_HOME/log/hostname/agent/ohasd/oracssdagent_root/ohasd/oracssdagent_root.log
$GRID_HOME/log/hostname/agent/ohasd/oracssdmonitor_root/oracssdmonitor_root.log
5、CSSD
主要管理节点成员信息并分发配置,所有成员节点上的CSSD进程间会产生网络心跳,CSSD的网络心跳及voting disk的磁盘心跳共同来监视集群的健康状况和节点的成员身份,当有节点加入或者离开集群时,也是由CSSD进程投票并通知注册的进程组发起集群重构。如果CSSD不能正常启动,这个节点是不能加入集群的。日志位置$GRID_HOME/log/hostname/cssd/ocssd.log
6、CRSD
负责应用资源的可用性,负责启动、关闭、重新分配这些资源
负责维护OCR中资源记录的完整性
负责OCR的备份
负责启动oraagent和orarootagent进程
日志位置$GRID_HOME/log/hostname/crsd.log
Oraagent
如果grid和rdbms是用两个用户安装的,基本都是一个grid、一个oracle,这样就会启动两个oraagent,一个以grid用户身份运行,一个以oracle用户身份运行,其中grid的这个oraagent负责diskgroup、node listener、scan listener、ons、eons,而oracle这个oraagent负责数据库、实例和服务。
Grid用户的日志位置$GRID_HOME/log/hostname/agent/crsd/oraagent_grid/oraagent_grid.log
Orarootagent
CRSD启动的这个以root身份运行的agent负责管理GNS、VIP、node vip、scan vip等网络资源。日志位置$GRID_HOME/log/hostname/agent/crsd/orarootagent_root.log
Scriptagent
如果使用grid监管第三方的应用程序,比如Tomcat,也必须通过Agent框架,这些资源就是通过这个agent进行管理的,日志位置$GRID_HOME/log/hostname/agent/crsd/scriptagent_grid/scriptagent_grid.log
Grid的进程和启动顺序
1、第一阶段
ohasd的活动
这个阶段是OHASD的舞台,要启动4个agent,分别是oraagent(grid)、orarootagent(root)、cssdagrent(root)和cssdmonitor(root)
2、第二阶段
rootagent活动
由ohasd启动的orarootagent启动下面几个进程
CRSD(root)、CTSSD(root)、diskmon、ACFS driver(root)
Oragent活动
由ohasd启动的oraagent进程负责启动下面的进程和服务,以grid身份运行
ASM,ASM实例,用于挂载磁盘组
EVMD
MDNSD
GIPCD,用于进程间和节点间的通信协议
GPnPD
Cssdagent活动
以grid用户运行,不再启动其他进程
3、第三阶段
CRSD的活动
启动2或3个agent,注意ohasd也启动agent,它们的日志位置不同。
4、第四阶段
Orarootagent活动
Network resource,对应public network
SCAN VIP(s),有SCAN VIP和SCAN listener 配对组成
Nodes VIPs,public的vip地址
ACFS registry,用户挂载ACFS文件系统
GNS VIP(可选)
Oraagent(grid)活动
ASM实例
Diskgroup,管理监控ASM磁盘组
SCAN listener,监听SCAN VIP的监听器
Listener,监听VIP的节点监听器
ONS,oracle notification service ,oracle事件通知服务
eONS,增强版ONS
GSD,向后兼容oracle9i的服务,如果环境中没有oracle9i数据库,这个进程不会启动
GNS(可选)
Oraagent(oracle)活动
DB,管理和监控DB和实例
Services,管理和监视service
配置文件
1、GPnP(grid plug andplay)
[grid@rac1 bin]$ pwd
/u01/app/11.2.0/grid/bin
[grid@rac1 bin]$ gpnptool get
文件及日志位置
$GRID_HOME/gpnp/profiles/peer/profile.xml
$GRID_HOME/log/rac1/gpnpd/gpnpd.log
2、OLR(oracle local registry)
OLR文件中记录的是本地节点的元数据,OLR中记录的是ohasd启动所必需的的信息,它和GPnP文件一起提供了这个节点要加入到集群中所需要的信息,而OCR中记录的是CRSD需要的信息,因此,OHASD栈的启动只需要OLR、GPnP profile就可以,不需要OCR的内容。它的内容格式和OCR一样,也是key、value的格式。OLR是由OHASD管理的。OLR本身就是OCR的提取,因此格式和OCR一样,只是内容更少,它不需要集群中共享。所有用于OCR的命令也都可以用于OLR,只是需要给这些命令加入-local参数
[root@rac1 bin]# pwd
/u01/app/11.2.0/grid/bin
[root@rac1 bin]# ./ocrcheck -local
Status of Oracle Local Registry is as follows :
Version : 3
Total space (kbytes) : 262120
Used space (kbytes) : 2644
Available space (kbytes) : 259476
ID : 1185246337
Device/File Name : /u01/app/11.2.0/grid/cdata/rac1.olr
Device/File integrity check succeeded
Local registry integrity check succeeded
Logical corruption check succeeded
3、OCR(oracle cluster registry)
Grid 11.2 不在支持裸设备,OCR是作为普通的ASM文件保存在ASM中。但是CRSD不能直接读取ASM磁盘,必须通过ASM实例才行,因此必须先把ASM实例启动,然后ASM实例挂载包含OCR的ASM磁盘组,然后CRSD才能启动。同理,如果想关闭ASM实例,必须先关闭连接ASM实例的客户端
查看文件位置
[root@rac1 oracle]# pwd
/etc/oracle
[root@rac1 oracle]# ls
lastgasp ocr.loc ocr.loc.orig olr.loc olr.loc.orig oprocd scls_scr setasmgid
自动备份位置
/u01/app/11.2.0/grid/cdata/prod
[root@rac1 prod]# ls
backup00.ocr backup01.ocr backup02.ocr day.ocr week.ocr
[root@rac1 bin]# ./ocrconfig -showbackup
rac1 2014/03/31 13:36:54 /u01/app/11.2.0/grid/cdata/prod/backup00.ocr
rac1 2014/03/28 19:30:52 /u01/app/11.2.0/grid/cdata/prod/backup01.ocr
rac1 2014/03/28 15:30:11 /u01/app/11.2.0/grid/cdata/prod/backup02.ocr
rac1 2014/03/31 13:36:54 /u01/app/11.2.0/grid/cdata/prod/day.ocr
rac1 2014/03/28 15:30:11 /u01/app/11.2.0/grid/cdata/prod/week.ocr
4、voting file
Voting file 记录集群的节点以及每个节点的状态,提供集群节点成员身份管理和节点隔离功能。Voting file的数量必须是奇数个,grid 11.2中voting file是保存在ASM磁盘组中的,实际上是保存在其中一个磁盘之上,而不是想普通的ASM文件那样跨多个磁盘。CSSD是可以直接访问这个ASM磁盘的,这也就是为什么CSS可以在ASM之前被启动了。查看voting file的位置:crsctl query css votedisk
来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/29337971/viewspace-1133702/,如需转载,请注明出处,否则将追究法律责任。
转载于:http://blog.itpub.net/29337971/viewspace-1133702/