1.场景
RAC一个节点的虚拟机移动到另外一个环境,重新移动回来后无法启动。
su - grid
cd $ORACLE_BASE
cd diag/crs/实例名/crs/trace/ocssd.log
node2,hlhtdb1,has a disk HB,but no network HB,.....;
日志提示:有磁盘心跳,但是没有网络心跳。
2.检查集群私网心跳。
ping mydb1-priv --无法ping通
ping mydb2-priv --无法ping通
3.检查网络配置
ens224
ens456
发现 ens224 网卡上有两个IP,一个是数据库实例的IP,一个集群私网的IP.即集群私网IP和数据库实例的IP使用
同一个网卡。这里显然不对。
我们删除ens224上绑定的私网IP;
将私网IP添加到:ens456 网卡上。
重新启动CRS;
crsctl start has
--集群可以正常启动。
这里不太清楚是误操作导致的两个IP在同一个网卡上还是本身就是这样配置的。
但是将集群私网IP和数据库实例IP分开就解决了网络不通的问题。
4.集群启动顺序
crsctl stop has --关闭集群。
crsctl start has --启动集群。
启动顺序:
has
cssd
evmd
crsd
对应的日志目录:
su - grid
--检查集群下面的日志:
/oracle/app/grid/diag/crs/orcl/crs/trace/hasd.log
/oracle/app/grid/diag/crs/orcl/crs/trace/ocssd.log
/oracle/app/grid/diag/crs/orcl/crs/trace/evmd.log
/oracle/app/grid/diag/crs/orcl/crs/trace/crsd.log
5.总结
集群私网IP 和数据库实例IP必须配置在不同的网卡上,不能配置在同一块网卡。