[排错]安装Oracle 10g RAC报Failure at final check of Oracle CRS stack 10错误

同事已经装了好几天的Oracle 10g RAC了,在第二个节点执行root.sh的时候最后老是报:
Failure at final check of Oracle CRS stack 10
错误,crs,css,evm进程都无法启动。通过在网上,METALINK上查找解决办法都没能解决问题。
最后我就来和他一起来处理这个问题了,经过2天的时间终于解决了这个问题,下面把解决过程做一个描述:

操作系统是RedHat Enterprise Linux 64bit,2台数据库服务器是2台HP很新的DL380 G7,BIOS是最新的版本 9/30/2010,存储使用的是HP EVA 4400。

我来了之后从重新安装操作系统开始,服务器在安装完成,重启的时候会频繁出现"红屏"现象,但有时候有些盘又不会出现"红屏"现象,经过10多次测试、安装后,终于将2台服务器系统安装成功了。我们以为有些盘有问题,但有时候同一张盘也会出现"红屏"的情况,一直感觉这里不太对劲,在想"红屏"现象跟我们的报错是不是有联系。带着这种疑问我们再次安装了Oracle RAC,结果依然报同样的错误。太杯具了!!!我都快没辙了!

这个时候我们越发感觉服务器不对劲,安装Oracle RAC步骤没错,但依然报错,网上说的导致此问题的原因在我们系统都不存在,安装操作系统出现的"红屏"现象更加深了我这种担忧,于是我与HP在线工程师交流(HP在线工程师这个支持方式真是不错,赞啊!),由于BISO已经是最新版本了,HP工程师建议将固件(Firmware)进行升级,通过他给我的地址和方法,我下载了最新版本的固件升级文件,并刻录成光盘,下午的时候去机房对2台服务器的固件进行了升级。

在升级过程中发现,升级的对象包括有Linux 64bit的一个bundle,跟客户交流发现,他们大部分都安装的是windows系统,即使有Linux,也都是32bit的系统。由此可以推断客户在之前的系统安装并没有出现"红屏"的现象是因为安装的操作系统要么是windows的,要么是linux 32bit的,所有没有遇到问题。当在客户最新采购的多台DL380 G7的服务器中安装Linux 64bit系统的时候就可能出现这种”红屏“的现象。

通过对服务器固件的升级,再次安装系统,再也没有出现"红屏"的现象了,越发觉得一会儿的Oracle RAC安装有戏了。晚上再次安装Oracle RAC,果然一切正常了!
 
由此完成了集群环境的搭建,根本原因在于服务器是较新推出的服务器,是个新机器,以前并没有安装过Linux 64bit的操作系统,bios是最新的,固件在支持Linux 64bit的系统上存在问题,通过升级固件的版本解决了此问题,最终使得安装Oracle RAC报Failure at final check of Oracle CRS stack 10的错误得以解决。

HP啊,你可把我害苦啦,2天时间哦,我焦心啊,不过总算解决了,特写篇文章和大家分享。


固件升级文件(需刻录成光盘):
http://h20000.www2.hp.com/bizsupport/TechSupport/SoftwareDescription.jsp?lang=en&cc=us&prodTypeId=15351&prodSeriesId=4091412&prodNameId=4091432&swEnvOID=1005&swLang=8&mode=2&taskId=135&swItem=MTX-98ce7a50a19a4d4994aaad8d0e


升级方法:
http://h20565.www2.hp.com/portal/site/hpsc/template.PAGE/public/kb/docDisplay/?javax.portlet.endCacheTok=com.vignette.cachetoken&javax.portlet.begCacheTok=com.vignette.cachetoken&javax.portlet.prp_0fad509463bfc78c56efe910b053ce01=wsrp-navigationalState%3DdocLocale%25253Dzh_CN%25257CdocId%25253Demr_na-c01776095&javax.portlet.tpst=0fad509463bfc78c56efe910b053ce01&ac.admitted=1293636755843.876444892.492883150


另外总结一下网上说的出现Failure at final check of Oracle CRS stack 10报错可能的原因:
1.防火墙未关闭。
2.重新安装Clusterware,文件未清理干净(查看METALINK文章:How to Clean Up After a Failed 10g or 11.1 Oracle Clusterware Installation [ID 239998.1])。
3.检查共享存储的权限问题。
4.私有心跳连接存在问题。
5.检查ssh配置不正确。
6.重新安装Clusterware,/tmp/.oracle/,/var/tmp/.oracle/,/usr/tmp/.oracle/目录未清空。

Hp最新的固件版本下载:
HP Smart Update Firmware DVD
http://h20000.www2.hp.com/bizsupport/TechSupport/DriverDownload.jsp?prodNameId=1844068&lang=en&cc=us&taskId=135&prodTypeId=18964&prodSeriesId=1844067

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/23135684/viewspace-682839/,如需转载,请注明出处,否则将追究法律责任。

转载于:http://blog.itpub.net/23135684/viewspace-682839/

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值