【Oracle-RAC】著名的bug 10058182 导致的CRSD 挂起

1.环境 

SUSE11+11.1.0.7 crs,双节点 
用户发现集群运行一段时间之后,大部分的crs_stat,srvctl 命令都会 
挂起。重启集群虽然能够短暂解决问题,但是此问题很快会出现。

2.过程分析

问题是crs_stat 命令会挂起。
--查看集群状态 
crsctl check crs 
集群状态正常 
由于crs_stat 和srvctl 命令是用来查询集群资源状态的,所以他们
会和CRSD 进行通信。查看 crsd.log; 
Action Script /u01/app/db/bin/racgwrap timed out for ora.test.test1.inst;
(timeout=600)

该问题和10gr2版本的一个已知问题相似。该问题在:11.1.0.7 版本修复。
ps -ef |grep "racgmain check"|wc -l 

之前的已知问题是由于 racgwrap 的文件的最后几行有问题,需要修改。
检查 racgwrap的最后几行:
ORA_RACG_VIP_FALLBACK=1 && export ORA_RACG_VIP_FALLBACK 
exec $ORACLE_HOME/bin/racgmain "$@"
脚本没有问题。

重新排查: 
不部分的crs_stat,srvctl 命令都会挂起,由于 crs_stat 和srvctl 
命令会访问crsd.bin 守护进程。crsd.log 显示,crsd.bin 守护进程 
出现超时现象: 
Action Script /u01/app/db/bin/racgwrap timed out for ora.test.test1.inst;
(timeout=600)
,所以crsd.bin 应还在运行,但是有可能一直在执行某些特定的操作或者
陷入了死循环。
pstat 8888  --8888 是 crsd 守护矜持点操作系统进程号。
Thread 1275

crsd.bin 守护进程启动了1000多个线程。结合上面的信息,推测是一个BUG 
引起:BUG 10058182 

3.解决方法 

应用补丁10058182 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值