今天在例行检查集群的时候,发现有两个节点出现了僵尸进程。
首先通过ganglia界面发现情况如下图:
一直会有系统进程在运行。
登录到其中一台机器发现,有个任务Child没有退出(通过jps这个命令查看)。
查看当前这个进程的运行状态如下图:
证明确实出现了僵尸进程。
然后将此僵尸进程杀掉后,节点运行正常如下图:
今天在例行检查集群的时候,发现有两个节点出现了僵尸进程。
首先通过ganglia界面发现情况如下图:
一直会有系统进程在运行。
登录到其中一台机器发现,有个任务Child没有退出(通过jps这个命令查看)。
查看当前这个进程的运行状态如下图:
证明确实出现了僵尸进程。
然后将此僵尸进程杀掉后,节点运行正常如下图: