WAS startnode hang问题解决[@more@]
WAS的集群环境,假设192.168.1.10为A机 192.168.1.20为B机,A、B两机做Cluster,Dmger在A机。因为春节下电,开机时现象是,Dmger正常,B机上的Node正常启动,但是A机上的Node启动时,出现“”后,无响应,查询系统启动日志,无记录。
检查一下操作系统的状态,内存、磁盘空间一切正常。ps -ef|grep java系统进程也在。
打开trace查看node启动的问题记录:
#startNode.sh -trace
从系统日志中无法看出系统异常。
于是联想到去年曾经在配置结点时federate异常,最后是因为JVM的share memory问题造成。最后IBM建议按该问题处理。1、启动dmgr,在管理控制台系统管理中,选择无法启动的那个nodeagent,在进程管理->进程定义->java虚拟机 的通用jvm参数里添加“-Xshareclasses:nonfatal”,保存。
(查看configcellsnodesserversnodeagentserver.xml
确认genericJvmArguments里设置了-Xshareclasses:nonfatal)
2、在无法启动的节点的bin下执行syncNode命令,强制节点配置于dmgr同步,同步后查看configcellsnodesserversnodeagentserver.xml,
确认genericJvmArguments里设置了-Xshareclasses:nonfatal。
3、启动nodeagent。
设置后,重启Dmgr和Node后,Node正常启动!据说WAS 6109会对share classes问题修正。