当oracle rac出问题时,很多人往往不知道从何查起,我根据自己在生产上排查的经验,说一下自己的排查思路。
一、查看系统时间是否同步
1、date
2、不同步的进行同步,在两个节点上执行:
ntpdate -u 1.cn.pool.ntp.org
3、重启有问题的节点
【时间不同步,断电后数据库启动时crs启动失败导致asm启动失败,最后数据库启动失败,asm日志信息报i/o错误、找不到磁盘组等,可能会误导问题的定位,其实只是时间不同步导致的问题,找到问题的根源,重启即可】
二、查看防火墙是否关闭
ping 私有ip,vip,如果不通,先按下面步骤操作:
1、 查看防火墙状态:service iptables status
2、 如果防火墙是开的,就关闭:service iptables stop
3、 设置防火墙不要开机启动:chkconfig iptables off
4、 检查上一步是否设置成功:chkconfig --list iptables
关闭防火墙
重启有问题节点数据库即可。
三、查看归档日志空间情况
归档日志满的话会导致数据库异常,删除过期日志可解决。
1、 进入grid 用户