同事已经装了好几天的Oracle 10g RAC了,在第二个节点执行root.sh的时候最后老是报:
Failure at final check of Oracle CRS stack 10
错误,crs,css,evm进程都无法启动。通过在网上,METALINK上查找解决办法都没能解决问题。
最后我就来和他一起来处理这个问题了,经过2天的时间终于解决了这个问题,下面把解决过程做一个描述:
操作系统是RedHat Enterprise Linux 64bit,2台数据库服务器是2台HP很新的DL380 G7,BIOS是最新的版本 9/30/2010,存储使用的是HP EVA 4400。
我来了之后从重新安装操作系统开始,服务器在安装完成,重启的时候会频繁出现"红屏"现象,但有时候有些盘又不会出现"红屏"现象,经过10多次测试、安装后,终于将2台服务器系统安装成功了。我们以为有些盘有问题,但有时候同一张盘也会出现"红屏"的情况,一直感觉这里不太对劲,在想"红屏"现象跟我们的报错是不是有联系。带着这种疑问我们再次安装了Oracle RAC,结果依然报同样的错误。太杯具了!!!我都快没辙了!
这个时候我们越发感觉服务器不对劲,安装Oracle RAC步骤没错,但依然报错,网上说的导致此问题的原因在我们系统都不存在,安装操作系统出现的"红屏"现象更加深了我这种担忧,于是我与HP在线工程师交流(HP在线工程师这个支持方式真是不错,赞啊!),由于BISO已经是最新版本了,HP工程师建议将固件(Firmware)进行升级,通过他给我的地址和方法,我下载了最新版本的固件升级文件,并刻录成光盘,下午的时候去机房对2台服务器的固件进行了升级。
在升级过程中发现,升级的对象包括有Linux 64bit的一个bundle,跟客户交流发现,他们大部分都安装的是windows系统,即使有Linux,也都是32bit的系统。由此可以推断客户在之前的系统安装并没有出现"红屏"的现象是因为安装的操作系统要么是windows的,要么是linux 32bit的,所有没有遇到问题。当在客户最新采购的多台DL380 G7的服务器中安装Linux 64bit系统的时候就可能出现这种”红屏“的现象。
通过对服务器固件的升级,再次安装系统,再也没有出现"红屏"的现象了,越发觉得一会儿的Oracle RAC安装有戏了。晚上再次安装Oracle RAC,果然一切正常了!
由此完成了集群环境的搭建,根本原因在于服务器是较新推出的服务器,是个新机器,以前并没有安装过Linux 64bit的操作系统,bios是最新的,固件在支持Linux 64bit的系统上存在问题,通过升级固件的版本解决了此问题,最终使得安装Oracle RAC报Failure at final check of Oracle CRS stack 10的错误得以解决。
HP啊,你可把我害苦啦,2天时间哦,我焦心啊,不过总算解决了,特写篇文章和大家分享。
另外总结一下网上说的出现Failure at final check of Oracle CRS stack 10报错可能的原因:
1.防火墙未关闭。
2.重新安装Clusterware,文件未清理干净(查看METALINK文章:How to Clean Up After a Failed 10g or 11.1 Oracle Clusterware Installation [ID 239998.1])。
3.检查共享存储的权限问题。
4.私有心跳连接存在问题。
5.检查ssh配置不正确。
6.重新安装Clusterware,/tmp/.oracle/,/var/tmp/.oracle/,/usr/tmp/.oracle/目录未清空。
Hp最新的固件版本下载:
HP Smart Update Firmware DVD
http://h20000.www2.hp.com/bizsupport/TechSupport/DriverDownload.jsp?prodNameId=1844068&lang=en&cc=us&taskId=135&prodTypeId=18964&prodSeriesId=1844067
来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/23135684/viewspace-682839/,如需转载,请注明出处,否则将追究法律责任。
转载于:http://blog.itpub.net/23135684/viewspace-682839/