现场环境:

SUSE9SP3linux +VCS4.1MP4双机

问题描述:

启动VCS双机报错
#hastart
 dNFS_Disks            urp9fs3              *FAULTED* 
 
group            resource             system               message            
--------------- -------------------- -------------------- --------------------
                                     fs3              STALE ADMIN WAIT: all systems stale
                                     fs4              STALE ADMIN WAIT: all systems stale
 
日志DiskReservation_A.log中报错
2011/05/23 11:57:26 VCS ERROR V-16-10031-2005 DiskReservation:dNFS_Disks:monitor:GETSTAT failed. return=-1, errno=5, scsi=0x10000.
                                    
 问题处理: 
1.       检查GAB(Group Membership Services/Atomic Broadcast),发现异常,
#/sbin/gabconfig -a
屏幕显示如下类似信息,
GAB Port Memberships
===============================================================
Port a gen f29111 membership 01
表明双机心跳不正常,GAB 没有通过验证。
重新启动该服务无效;
 
2.       检查心跳地址,可以互相PING通,排除网卡问题;
3.       重新启动服务器后检查GAB已经恢复正常。
#/sbin/gabconfig -a
屏幕显示如下类似信息,表明双机心跳正常,GAB 通过验证。
GAB Port Memberships
===============================================================
Port a gen f29111 membership 01
Port h gen f29113 membership 01
4.启动双机依然报同样错。检查配置发现多出一个.sale文件,正常情况下此文件是不存在的(stale表示过期)
5,删除.stale文件后重启双机可正常启动。