GBase 8a集群上线项目扩容操作,最终用户出于安全考虑,都会做安全加固,结果就是一些命令表面看着很正常,可是一旦远程运行,或者多几次用户su切换,就会出问题。
现象
GBase 8a V86集群扩容操作后,报错,新节点服务无法正确启动。
排查
查案gcinstall.log日志
get cluster task id fail,该错误,一般是因为集群LOCK状态,gcluster无法从gcware层拿到任务编号。
查看 集群状态
集群为LOCK状态,因为5个gcware里有i3个是CLOSE状态,正好是新扩容的3个节点。截图中没有显示出来CLOSE字样