11.2 RAC CSS 文档翻译(1)

1.4 集群同步服务(CSS)

CSS守护进程(OCSSD)管理集群的配置,集群里有哪些节点,并在有节点离开或加入时通知集群成员。

    ASM和数据库实例的其他集群守护进程依赖于一个有效的CSS。如果OCSSD因任何原因不能引导程序,比如没有发现表决文件信息,所有其他层级将无法启动。
    OCSSD还可以通过网络心跳(NHB)和磁盘心跳(DHB)监控集群的健康。网络心跳是判断一个节点是否还活着并能参与群集主要的指标。而磁盘心跳将主要用于解决脑裂。

1.4.1 主要的集群成员线程

下面的部分将列出并解释ocssd使用的线程。

- 集群监听线程(CLT) - 试图在启动时连接到所有远程节点,接收和处理所有收到的消息,并响应其他节点的连接请求。每当从节点收到一个数据包,监听重置该节点漏掉的统计数量。

 

- 发送线程(ST) -专门每秒发送一次网络心跳(NHB)到所有节点,和使用GIPC每秒发送一次本地心跳(LHB)到cssdagent和cssdmonitor。

 

 - 轮询线程(PT) - 监视远程节点的NHB的。如果CSS守护进程之间的通信通道发生故障时,心跳会被错过。如果某一个节点有太多的心跳信号被错过了,它被怀疑是关闭或断开。重新配置的线程会被唤醒,重新配置将发生,并最终将一个节点驱逐。

 

  • 重新配置管理线程(RMT)-当轮询进程要求重新配置时,初始化和管理集群重新配置在重新配置管理节点上(RMN)。如果重新配置管理节点失败了,重新配置管理进程会在剩余的节点上通过磁盘心跳监控健康状态来完成重新配置。


    在重新配置管理节点上,唤醒的重新配置管理线程着眼于每个节点,看哪些节点已经错过了NHB的太久。在重新配置管理线程参与了与其他CSS守护程序表决进程中,一旦确定了新的群集成员,重新配置管理器线程会在表决文件写入驱逐通知。该RMT还发送关闭消息给被驱逐的节点。表决文件会监控检查裂脑,直到他们的磁盘心跳已经停止了<misscount>秒,远程节点才会被踢走。


    - 发现进程 -发现表决文件

        - 隔离线程 - 用于与diskmon进程通信隔离I / O,如果使用EXADATA。

1.4.2 表决文件集群成员线程

 

- 磁盘ping线程(每个表决文件)
      与它相关联的节点数量和递增序列号的表决文件一起写入群集成员的当前视图;
      读取杀块看它的主机节点是否已被驱逐;
      这个线程还监视远程节点表决磁盘心跳信息。磁盘心跳信息,以便重新配置过程中用于确定一个远程OCSSD是否已经终止。

 

- 杀块线程 - (每个表决文件)监控表决文件可用性,以确保足够可访问的表决文件的数量。如果使用的Oracle冗余,我们需要配置多数表决磁盘在线。

    - 工作线程 - (11.2.0.1里新增加的,每个表决文件)各种I / O在表决文件上。

    - 磁盘Ping监视器 - 监视表决文件I/O状态

此监视线程,确保磁盘ping线程正确地读取多数表决配置文件里的杀块。如果我们不能对表决文件进行I/O操作,由于I / O挂起或I / O故障或其他原因,我们把这个表决文件设置离线。该线程监视磁盘ping线程。如果CSS是无法读取多数表决文件,它可能不再与其他节点共享至少一个磁盘。可能是这个节点错过了驱逐通知;换句话说,CSS是不能够进行合作,并必须被终止。

 

1.4.3 其他线程- 偶尔的(Occasionally)

- 节点杀死线程 - (瞬时的)用于通过IPMI杀死节点
- 成员杀死线程 - (瞬时的)杀成员期间使用
        成员-杀死(监控)线程

        本地杀死线程 - 当一个CSS客户端开始杀死成员,当地CSS杀死线程将被创建
- SKGXN监视器(skgxnmon只出现在供应商集群软件)

这个线程注册为SKGXN组的节点成员,观察节点组成员身份的变化。当重新配置事件发生时,该线程从SKGXN请求当前节点组成员的位图,并将其与它接收到的最后的时间和其他两个位图的当前值的位图:驱逐待定,其标识节点在被关闭中,VMON的组成员,这表明其节点的过程oclsmon仍在运行(节点仍然是up的)。当一个成员的转变被确认,节点监视线程启动相应的操作。

 

1.4.4 其他CSS琐事

在Oracle集群11g第2版(11.2)减少了配置要求,这意味节点启动时自动添加回去,如果已经停机很久则删除它们。停止超过一个星期节点层不再汇报。当他们离开集群这些服务器自动管理,所以你不必从集群中明确地将其删除。

 

固定节点

相应的命令来更改节点固定行为(固定或不固定任何特定节点),是crsctl pin/unpin的CSS命令。固定节点是指节点名称与节点号码的关联是固定的。如果一个节点不固定,如果租赁到期时,节点号可能会改变。一个固定节点的租约永不过期。用crsctl delete node命令删除一个节点隐含取消节点固定。
        - 在Oracle集群升级,所有服务器都固定,而经过Oracle集群的全新安装11g第2版(11.2),您添加到集群中的所有服务器都不固定。
        - 在安装了11.2集群的服务器上有比11.2早版本的实例,那么您无法取消固定。

固定一个节点需要滚动升级到Oracle集群件11g第2版(11.2),将自动完成。我们已经看到有客户进行手动升级失败,是因为没有固定节点。

 

端口分配

对于CSS和节点监视器固定端口分配已被删除,所以不应该有与其他应用程序的端口竞争。唯一的例外是滚动升级过程中我们分配两个固定的端口。

 

GIPC

该CSS层是使用新的通信层Grid PC(GIPC),它仍然支持11.2之前使用CLSC通信层。在11.2.0.2,GIPC将支持的使用多个NIC的单个通信链路,例如CSS / NM间的通信。

 

集群告警日志

多个cluster_alert.log消息已被添加便于更快的定位问题。标识符将在alert.log和链接到该问题的守护程序日志条目都被打印。标识符是组件中唯一的,例如CSS或CRS。

2009-11-24 03:46:21.110

[crsd(27731)]CRS-2757:Command 'Start' timed out waiting for response from the resource 'ora.stnsp006.vip'. Details at (:CRSPE00111:) in

/scratch/grid_home_11.2/log/stnsp005/crsd/crsd.log.

 

2009-11-24 03:58:07.375

[cssd(27413)]CRS-1605:CSSD voting file is online: /dev/sdj2; details in

/scratch/grid_home_11.2/log/stnsp005/cssd/ocssd.log.

 

独占模式

在Oracle集群11g第2版(11.2)集群独占模式是一个新的概念。此模式将允许您在一个节点上启动堆栈几乎不需要其他要求。不需要表决文件,不需要网络连接。此模式用于维护或故障定位。因为这是一个用户调用命令确保在同一时刻只有一个节点是开启的。在独占模式下root用户在某一个节点上使用crsctl start crs –excl命令启动堆栈。

如果集群中的另一个节点已经启动,那么独占模式启动时将失败。OCSSD守护进程会主动去检查节点,如果发现有其他节点已经启动,那么启动将失败报CRS-4402。这不是错误;这是一个预期的行为,因为另一节点已经启动。约翰·利思说,“你收到CRS-4402时是没有错误文件的”。

 

发现表决文件

识别表决文件的方法在11.2已经改变。表决文件在11.1和更早版本里配置在OCR上,11.2表决文件通过在GPNP配置文件中的CSS表决文件发现字符串指定位置。 例如:

 

CSS voting file discovery string referring to ASM

发现CSS表决文件字符串指向ASM,将使用在ASM搜寻字符串值。最常见的是你会看到系统这个配置(例如Linux中,使用旧的2.6内核),其中裸设备仍可配置,裸设备被CRS和ASM使用。

例如:

<orcl:css-profile id="css" span=""

DiscoveryString=”+asm"

LeaseDuration="400"/>

 

对于ASM搜寻字符串空值意味着它将恢复到特定的操作系统默认情况下。在Linux上就是/dev/raw/raw*。

 

CSS voting file discovery string referring to list of LUN’s/disks

在下面的例子中,CSS文件表决字符串发现是指向磁盘/ LUN列表中。这可能是配置在块设备或设备使用非默认位置。在这种情况下,对于CSS VF发现字符串与ASM发现字符串的值是相同的。

 

一些表决文件标识符必须在磁盘上找到接受它作为一种表决磁盘:文件的唯一标识符,集群GUID和匹配的配置化身号configuration incarnation number(CIN)。可以使用vdpatch检查设备是否是一个表决文件。

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/30935525/viewspace-2084278/,如需转载,请注明出处,否则将追究法律责任。

转载于:http://blog.itpub.net/30935525/viewspace-2084278/

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值