RAC的CRS Resource包括GSD(global service daemon),ONS(oracle notification service daemon),VIP,Database,Instance,Listener和Serivce.
Oracle把这些Resource分成两组:nodeapps和database-related resource.前者包括GSD,ONS,VIP,Listener,后者包括Database,Instance,Service.
健忘的问题都过OCR解决,脑裂的问题通过VotingDisk解决.
OCR中保存整个集群的配置信息,配置信息以key-value的形式保存其中.用户指定的这个位置会被记录在/etc/oracle/ocr.loc(linux)或
/var/opt/oracle/ocr.loc(solaris).
整个OCR的信息是个树形结构,有3大分支,分别是system,database和crs.
Clusterware最重要的3个进程是crsd,cssd,evmd.
ocssd这个进程是clusterware最关键的进程,如果这个进程出现异常,会导致系统重啟.这个进程提供css(cluster synchronization service)服务.
css服务通过多种心跳机制,实时监控集群健康状态,提代脑裂保护等基础集群服务功能.css服务有两种心跳机制:一种通过私有网路的network
hearbeat,另一种是通过voting disk的disk heartbeat.这两个心跳都有最大时延,对于disk heartbeat,这个时延叫作iot(i/o timeout);对于
network heartbeat,这个时延叫作mc(miscount).两个参数都是以秒為单位,缺省时iot大于mc.缺省情况下,这两个参数是oracle自动判定,并不建议
调整.
CRSD是实现高可用性的主要进程,它所提供的服务是crs(cluster ready service)服务,监控应用层资源,并在这些资源运行异常时进行干预,包括关
闭,重啟进程或者转移服务.
所有需要高可用的组件,都会在安装配置的时候,以crs resource的形式登记到ocr中,而crsd进程就根据ocr中的内容,决定监控那些进程,如何监控,
出现问题时如何解决.
EVMD这个进程负责发布CRS產生的各种事件.这些Event可以通过两种方式发布给客户--ONS和Callout Script.
RACGIMON这个进程负责检查数据库健康状态,负责Service的啟动,停止,故障转移.
OPROCD进程也叫做Process Monitor Daemon.在非Linux平臺上,并且没有使用第三方的集群软件时,会有这个进程,这个进程用来检测节点的
processor hang,如果调度时间超过1.5秒,就会认為cpu工作异常,会重啟节点,也就是说这个进程提供的是io 隔离功能.linux 平臺上是利用
hangcheck-timer模组来实现io隔离功能的.
Cache Fusion Resource(PCM Resource)特指数据块这种资源,包括普通数据块,索引数据块,段头块,undo数据块.
非数据块资源全部都归类為Non-Cache Fusion Resource(Non-PCM Resource);
LMSn进程是Cache Fusion的主要进程,负责数据块在实例间的传递,对应的服务叫做GCS,这个进程的名称来源于Lock Manager Service.这个进程
的数量通过参数GCS_SERVER_PROCESS来控制,缺省值是2个,取值范围為0~9.
LMD负责的是Global Enqueue Service(GES).这个进程负责在多个实例之间协调对数据块的访问顺序,保证数据的一致性访问.
LCK负现非Non-Cache Fusion资源的同步访问,每个实例有一个LCK进程.
LMON在各实例间会定期通信,通检查集群中各节点的健康状态,当某个节点出现故障时,负责集群重构,GRD恢復等操作,它提供的服务叫作Cluster
Group Services(CGS).
DIAG进程监控实例的健康状态,并在实例出现运行错误时收集诊断数据记录到Alert.log日誌中.
GSD进程负责从客户端工具,接收用户命令,為用户提供管理接口.
Oracle把这些Resource分成两组:nodeapps和database-related resource.前者包括GSD,ONS,VIP,Listener,后者包括Database,Instance,Service.
健忘的问题都过OCR解决,脑裂的问题通过VotingDisk解决.
OCR中保存整个集群的配置信息,配置信息以key-value的形式保存其中.用户指定的这个位置会被记录在/etc/oracle/ocr.loc(linux)或
/var/opt/oracle/ocr.loc(solaris).
整个OCR的信息是个树形结构,有3大分支,分别是system,database和crs.
Clusterware最重要的3个进程是crsd,cssd,evmd.
ocssd这个进程是clusterware最关键的进程,如果这个进程出现异常,会导致系统重啟.这个进程提供css(cluster synchronization service)服务.
css服务通过多种心跳机制,实时监控集群健康状态,提代脑裂保护等基础集群服务功能.css服务有两种心跳机制:一种通过私有网路的network
hearbeat,另一种是通过voting disk的disk heartbeat.这两个心跳都有最大时延,对于disk heartbeat,这个时延叫作iot(i/o timeout);对于
network heartbeat,这个时延叫作mc(miscount).两个参数都是以秒為单位,缺省时iot大于mc.缺省情况下,这两个参数是oracle自动判定,并不建议
调整.
CRSD是实现高可用性的主要进程,它所提供的服务是crs(cluster ready service)服务,监控应用层资源,并在这些资源运行异常时进行干预,包括关
闭,重啟进程或者转移服务.
所有需要高可用的组件,都会在安装配置的时候,以crs resource的形式登记到ocr中,而crsd进程就根据ocr中的内容,决定监控那些进程,如何监控,
出现问题时如何解决.
EVMD这个进程负责发布CRS產生的各种事件.这些Event可以通过两种方式发布给客户--ONS和Callout Script.
RACGIMON这个进程负责检查数据库健康状态,负责Service的啟动,停止,故障转移.
OPROCD进程也叫做Process Monitor Daemon.在非Linux平臺上,并且没有使用第三方的集群软件时,会有这个进程,这个进程用来检测节点的
processor hang,如果调度时间超过1.5秒,就会认為cpu工作异常,会重啟节点,也就是说这个进程提供的是io 隔离功能.linux 平臺上是利用
hangcheck-timer模组来实现io隔离功能的.
Cache Fusion Resource(PCM Resource)特指数据块这种资源,包括普通数据块,索引数据块,段头块,undo数据块.
非数据块资源全部都归类為Non-Cache Fusion Resource(Non-PCM Resource);
LMSn进程是Cache Fusion的主要进程,负责数据块在实例间的传递,对应的服务叫做GCS,这个进程的名称来源于Lock Manager Service.这个进程
的数量通过参数GCS_SERVER_PROCESS来控制,缺省值是2个,取值范围為0~9.
LMD负责的是Global Enqueue Service(GES).这个进程负责在多个实例之间协调对数据块的访问顺序,保证数据的一致性访问.
LCK负现非Non-Cache Fusion资源的同步访问,每个实例有一个LCK进程.
LMON在各实例间会定期通信,通检查集群中各节点的健康状态,当某个节点出现故障时,负责集群重构,GRD恢復等操作,它提供的服务叫作Cluster
Group Services(CGS).
DIAG进程监控实例的健康状态,并在实例出现运行错误时收集诊断数据记录到Alert.log日誌中.
GSD进程负责从客户端工具,接收用户命令,為用户提供管理接口.
来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/28539951/viewspace-1440591/,如需转载,请注明出处,否则将追究法律责任。
转载于:http://blog.itpub.net/28539951/viewspace-1440591/