问题已解决。
linux as4.0 u5 64bitoracle 10.2.0.3 64bit
ocfs2 rac , 2 nodes .
原来做过的10g rac都没有碰到过这种问题 。做过一次fail over测试,关闭节点1的public 网卡,之后恢复 。然后就
发现节点1 在os启动时所有服务及db都能自动启动 , 节点2 crs服务不能启动,inst也不能自动启动 。
# /etc/rc.d/init.d/init.crs enable 之后重新关闭服务数据库,启动,还是不行。
节点1 都是online , 节点2 状态都是unknown , 手动 srvctl start nodeapps -n ecsrac02 , 然后开启节点2实例 。
都变成online . 全部正常。
如何恢复成所有节点都能自动开启相关服务及实例自动开启呢 ??
ecsrac01$crs_stat -t
Name Type Target State Host
------------------------------------------------------------
ora.ecsdb.db application ONLINE ONLINE ecsrac01
ora....b1.inst application ONLINE ONLINE ecsrac01
ora....b2.inst application ONLINE UNKNOWN ecsrac02
ora....01.lsnr application ONLINE UNKNOWN ecsrac01
ora....c01.gsd application ONLINE ONLINE ecsrac01
ora....c01.ons application ONLINE ONLINE ecsrac01
ora....c01.vip application ONLINE ONLINE ecsrac01
ora....02.lsnr application ONLINE UNKNOWN ecsrac02
ora....c02.gsd application ONLINE UNKNOWN ecsrac02
ora....c02.ons application ONLINE UNKNOWN ecsrac02
ora....c02.vip application ONLINE ONLINE ecsrac02
ecsrac01$crs_stat -v
NAME=ora.ecsdb.db
TYPE=application
RESTART_ATTEMPTS=1
RESTART_COUNT=0
FAILURE_THRESHOLD=1
FAILURE_COUNT=0
TARGET=ONLINE
STATE=ONLINE on ecsrac01
NAME=ora.ecsdb.ecsdb1.inst
TYPE=application
RESTART_ATTEMPTS=5
RESTART_COUNT=0
FAILURE_THRESHOLD=0
FAILURE_COUNT=0
TARGET=ONLINE
STATE=ONLINE on ecsrac01
NAME=ora.ecsdb.ecsdb2.inst
TYPE=application
RESTART_ATTEMPTS=5
RESTART_COUNT=0
FAILURE_THRESHOLD=0
FAILURE_COUNT=0
TARGET=ONLINE
STATE=UNKNOWN on ecsrac02
NAME=ora.ecsrac01.LISTENER_ECSRAC01.lsnr
TYPE=application
RESTART_ATTEMPTS=5
RESTART_COUNT=0
FAILURE_THRESHOLD=0
FAILURE_COUNT=0
TARGET=ONLINE
STATE=UNKNOWN on ecsrac01
NAME=ora.ecsrac01.gsd
TYPE=application
RESTART_ATTEMPTS=5
RESTART_COUNT=0
FAILURE_THRESHOLD=0
FAILURE_COUNT=0
TARGET=ONLINE
STATE=ONLINE on ecsrac01
NAME=ora.ecsrac01.ons
TYPE=application
RESTART_ATTEMPTS=3
RESTART_COUNT=0
FAILURE_THRESHOLD=0
FAILURE_COUNT=0
TARGET=ONLINE
STATE=ONLINE on ecsrac01
NAME=ora.ecsrac01.vip
TYPE=application
RESTART_ATTEMPTS=0
RESTART_COUNT=0
FAILURE_THRESHOLD=0
FAILURE_COUNT=0
TARGET=ONLINE
STATE=ONLINE on ecsrac01
NAME=ora.ecsrac02.LISTENER_ECSRAC02.lsnr
TYPE=application
RESTART_ATTEMPTS=5
RESTART_COUNT=0
FAILURE_THRESHOLD=0
FAILURE_COUNT=0
TARGET=ONLINE
STATE=UNKNOWN on ecsrac02
NAME=ora.ecsrac02.gsd
TYPE=application
RESTART_ATTEMPTS=5
RESTART_COUNT=0
FAILURE_THRESHOLD=0
FAILURE_COUNT=0
TARGET=ONLINE
STATE=UNKNOWN on ecsrac02
NAME=ora.ecsrac02.ons
TYPE=application
RESTART_ATTEMPTS=3
RESTART_COUNT=0
FAILURE_THRESHOLD=0
FAILURE_COUNT=0
TARGET=ONLINE
STATE=UNKNOWN on ecsrac02
NAME=ora.ecsrac02.vip
TYPE=application
RESTART_ATTEMPTS=0
RESTART_COUNT=0
FAILURE_THRESHOLD=0
FAILURE_COUNT=0
TARGET=ONLINE
STATE=ONLINE on ecsrac02
ecsrac01$crsctl check crsd
CRS appears healthy
--------------------------------------------------------------------------------------
root:
#crsctl enable crs 之后重新启动还是不行 。
-----------------------------------------------------------------------------------------
升级到 10.2.0.4 不知道能不能解决 。
---------------------------------------------------------------------------------------------
原来安装的10g (10.2.0.3) RAC 数据库,重新启动不会出现不启动服务的问题。本次安装的
数据库,节点1 使用的是共享磁盘上的spfile参数 /ocfs_data1/ecsdb/spfileecsdb.ora ,
但是不知道为什么节点2 使用的却是 $ORACLE_HOME/dbs/spfileecsdb2.ora 文件 ,这个
目录下也存在着 initecsdb2.ora , 其中写的就是一个链接 spfile='/ocfs_data1/ecsdb/spfileecsdb.ora ' ,
不过show paramete spfile 查看发现节点2 用的spfile和节点1 不是同一个spfile . 也就是不是共享
磁盘上的spfile .
升级到Oracle 10.2.0.4 之后, 运行 SQL> ALTER SYSTEM SET CLUSTER_DATABASE=TRUE SCOPE=spfile; 的时候发现的 。 后来删除了节点2 上的 $ORACLE_HOME/dbs/spfileecsdb2.ora 文件 。 结果正常 。目前还不知道是spfile 不一样导致的,还是升级有效果 。
----------------------------------------------------------------------------------------------------
节点1, 2 OS启动后,等5~8分钟之后两个节点才会显示正常的 crs 服务 。
crs_stat -t 都是online. 否则crs_stat -t 报错或 显示offline .
会不会以前太着急没有等 就直接下了一些命令导致以为有问题 。
-----------------------------------------------------------------------------------------------------------
http://www.itpub.net/viewthread.php?tid=1088801&extra=&page=1
来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/35489/viewspace-498142/,如需转载,请注明出处,否则将追究法律责任。
转载于:http://blog.itpub.net/35489/viewspace-498142/