2、网络PING在MC时间内完成,磁盘ping超过了MC,但是在DISKTIMEOUT内完成,也不会驱逐 3、网络ping在MC时间内完成,磁盘ping超过了DISKTIMEOUT,则节点被驱逐 4、网络ping超过MC设置,磁盘ping在MC内完成,节点也会被驱逐 缺省情况下,MC是小于DISKTIMEOUT设置的 MISSCOUNT驱动着CLUSTER中的成员的重新配置并且直接影响对CLUSTER的访问。大多数情况下,缺省的MC设置可以被接受,改变缺省的MISSCOUNT不仅仅影响投票磁盘的I/O访问的超时时间,同时也会影响内网互连的网络心跳的超时时间。当修改缺省的MISSCOUNT值的时候应该考虑的问题: 增加MISSCOUNT的设置来解决I/O响应时间会直接导致网络失败时的重配置时间。网络心跳是cluster中的节点间连通性的主导,MISSCOUNT是触发cluster发生重配置前能够容忍发生多少的“check ins”,增加MISSCOUNT设置会延长对网络失败的诊断的时间,这将直接影响cluster的可访问性。 如果是因为底层磁盘的响应时间问题而修改了MISSCOUNT的值,那么底层地盘的问题解决后,要立刻修改MISSCOUNT回到缺省值。 如果是在第三方提供的CLUSTERWARE上实现的集群,则不要修改MISSCOUNT的缺省值,在这样的环境中修改缺省的MISSCOUNT将会导致更多的消耗和潜在的危险。 下面情况下不应该修改MISSCOUNT: 1、修改MISSCOUNT的值来避免因为底层的配置或者硬件的问题导致的超时 2、CLUSTER和数据库的可访问性直接受很高的MISSCOUNT设置的影响。 在Oracle RAC 10g Release 2 版本中允许设置多个的投票磁盘,从而不必依靠存储提供商的多路径的方式来解决磁盘访问的问题,你可以设置最多32个投票磁盘。 可以通过如下的方式来修改MISSCOUNT的设置: 1、首先停止CRS: 可以使用脚本来停止: 不同平台的脚本存放的地方如下: * For Solaris, the scripts are in /etc/init.d/ * For HP, the scripts are in /sbin/init.d * For AIX, the scripts are in /etc * For Linux, the scripts are in /etc/init.d 在上面的路径上执行init.crs stop脚本来停止,执行init.crs start来启动。 在10G RELEASE2版本中可以使用crsctl stop crs停止并使用crsctl start crs来启动。 2、设置MISSCOUNT为N 1) 除了一个节点外,关闭其他所有节点的CRS 2) 执行$ORA_CRS_HOME/bin/crsctl set css misscount 其中n为投票盘的响应时间+1 3) 重启动修改了MISSCOUNT参数的节点(这个需要测试是否是必须) 4) 启动所有其他的节点的CRS 打了4896338补丁后的10.2.0.1版本有两个附加的参数可以调整,这个改变直接包含在了10.2.0.2和10.1.0.6版本中 1) reboottime (缺省是3秒) -它定义了节点被CSS驱逐后到开始重启的时间间隔,也就是当你重启机器的时候机器完全关闭需要的时间。(这个间隔难道是为了正常关闭其他服务?) 2) disktimeout (缺省200秒) -对投票盘的I/O完成所允许的最大时间,如果达到了这个时间,则投票盘会被标识为OFFLINE。 Note that this is also the amount of time that will be required for initial cluster formation, i.e. when no nodes have previously been up and in a cluster. $CRS_HOME/bin/crsctl set css reboottime [-force] ( is seconds) $CRS_HOME/bin/crsctl set css disktimeout [-force] ( is seco 可以通过ocrdump命令来查看MISSCOUNT的设置,OCR备份的时间、路径、OCR的磁盘等信息。
来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/90618/viewspace-673727/,如需转载,请注明出处,否则将追究法律责任。
转载于:http://blog.itpub.net/90618/viewspace-673727/