最近又装了一遍64位下的HA,碰上2个问题,都是关于/etc/ha.d/ha.cf的问题,记录下。

问题1:lib库的路径要改成lib64

respawn root /usr/lib64/heartbeat/pingd -m 100 -d 5s

respawn root /usr/lib64/heartbeat/mgmtd -t -v
问题2:这个跟64位无关,是关于端口的,如果用默认的端口694,而又没有用直连的方式的话,就会有下列错误

ERROR: process_status_message: bad node [xxxxx] in message

这个node id不是你想要配的那组node的hostname,那么就要修改udp port,只要不重复,再重启heartbeat就好了。

另外记下之前其他人碰到的问题,unmanagement failed的问题,一般来说还是配置文件有问题。另外,其他资源的fail,比如IP fail也会导致某个服务资源的unmanagement fail,不过这个问题确实比较难搞,要多试几次才能找到问题。