地方同事报告生产库实例1连不上。
远程到地方服务器,查看系统进程状态,asm和oracle后台进程没有启动。查看集群环境进程发现Oracle rac 一节点crs无法启动,cssd进程处于 /etc/init.d/init.cssd startcheck 启动检查阶段。
这个库四川地震时出国宕机事件,后恢复,如今实例1离线,是否和hba卡有关系呢,查看系统与磁盘阵列的连接情况,看磁盘阵列是否挂载在系统下,fdisk -l 系统反馈信息是没有挂载磁盘阵列。实例离线是必然的。
实例2现在正常工作,启动实例1不会对系统照成影响,reboot 实例1数据库。远程上去后发现,Oracle RAC /etc/init.d/init.cssd startcheck init.cssd 进程还是无法初始成功。查看日志信息,没有发现报错信息,查看公有ip和私有ip配置正确,联通性正常。
系统会报错吗?看看系统日志,cat /var/log/messages | grep error
Jun 24 15:01:08 mss-db1 kernel: SCSI error : <0 0 13 1> return code = 0x10000
Jun 24 15:01:09 mss-db1 kernel: SCSI error : <0 0 13 1> return code = 0x10000
发现大量SCSI error 错误。
那hba卡连接问题怀疑性比较大了。前方工程师已经去了机房,重新接好mini线路。系统启动,oracle实例一重新加入集群环境。
来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/28985005/viewspace-764696/,如需转载,请注明出处,否则将追究法律责任。
转载于:http://blog.itpub.net/28985005/viewspace-764696/