Linux僵尸进程

前天跟一位“大神”级别的人物交流了一番,意识到什么是真正的“高”手,废话不多说,就其中的某一个问题且结合自己的经验总结一番,希望能给到屏幕前的你一些启示(以下是个人理解):

一体机进程有核间通信进程(DPAA)应用层业务,底软侧负责完成关于DPAA资源的初始化。实测过程中发现底软关于DPAA管理没处理好,导致一体机在测试反复重启的过程中出现僵尸进程,出现异常时会看到内核的打印调试信息。

为什么会产生僵尸进程呢?

底软的DPAA等于是一体机DPAA的父进程,一体机DPAA进程退出时,底软的DPAA需要用wait()或waitpid()系统调用取得子进程的终止状态来回收资源,一体机的进程虽然已经退出了,但是在系统进程表中还为它保留了一些退出状态的信息,如果底软DPAA进程一直不取得这些退出信息的话,这些进程表项就将一直被占用,就会造成一体机的进程变成了僵尸进程。通过PS命令可以查看其带有defunct的标志,僵尸进程是一个早已死亡的进程,但在进程表中仍占据一个位置。defunct进程是不能直接kill -9杀掉的,否则就不叫僵尸进程了。

但是如果该进程的父进程已经先结束了,那么该进程就不会变成僵尸进程。因为每个进程结束的时候,系统都会扫描当前系统中所运行的所有进程,看看有没有哪个进程是刚刚结束的这个进程的子进程,如果是的话,就由init进程来接管他,成为他的父进程,从而保证每个进程都会有一个父进程。而init进程会自动wait其子进程,因此被Init接管的所有进程都不会变成僵尸进程。

在Linux进程的状态中,僵尸进程是非常特殊的一种,它已经放弃了几乎所有的内存空间,没有任何可执行代码,也不能被调度,仅仅在进程列表中保留一个位置,记录在进程的退出状态等信息供其他进程收集,除此之外,僵尸进程不在占有任何内存空间。它需要父进程来为它收尸…如果父进程结束了,那么init进程会自动接手这个子进程来为它收尸,它还是能被清除的,但是如果父进程是一个循环不会结束,那么子进程就会一直保持僵尸状态,这就是为什么系统有时候会有很多的僵尸进程。

清除僵尸进程的方法:

把父进程杀掉,父进程死后,僵尸进程称为“孤儿进程”,过继给1号进程init,init始终负责清理僵尸进程,它产生的所有僵尸进程跟着消失。一般都不能杀掉defunct进程,用了kill -15,kill -9以后反而会多出更多的僵尸进程。

以下是转载,感谢原创作者,希望大家支持原创:

在UNIX系统中,一个进程结束了,但是其父进程没有等待(调用wait/waitpid)它,那么它将变成一个僵尸进程。通过PS命令可以查看其带有defunct的标志,僵尸进程是一个早已死亡的进程,但在进程表中仍占据一个位置;

一个进程在调用exit命令结束自己的生命时候,其实它没有真正的被销毁,而是留下一个称为僵尸进程的数据结构(系统调用exit,它的作用是使进程退出,但也仅仅限于将一个正常的进程变成一个僵尸进程,并不能将其完全销毁)。在Linux进程的状态中,僵尸进程是非常特殊的一种,它已经放弃了几乎所有的内存空间,没有任何可执行代码,也不能被调度,仅仅在进程列表中保留一个位置,记录在进程的退出状态等信息供其他进程收集,除此之外,僵尸进程不在占有任何内存空间。

为什么windows不会有僵尸进程? 
创建进程的方式在Windows(CreateProcess)和Linux(Fork)下的差异还是有的,但是也不是完全不能统一,麻烦点的就是Windows没有僵尸进程的概念导致进程ID不能真正区别出一个进程,比如说一个ID100的进程关闭了,然后一个新的进程启动后ID为100,并且父子进程之间的联系比Linux下要弱的多。 
进程之间相互独立;要进行等待需要显式写代码。

查看僵尸进程
top>> task (line)>> zombie..

清除僵尸进程
把父进程杀掉,父进程死后,僵尸进程称为“孤儿进程”,过继给1号进程init,init始终负责清理僵尸进程,它产生的所有僵尸进程跟着消失;

kill
kill命令可以带信号号码选项,也可以不带。如果没有信号号码,kill命令就会发出终止信号(15)

killall kill -15 kill -9 

一般都不能杀掉 defunct进程.. 用了kill -15,kill -9以后 之后反而会多出更多的僵尸进程

停止和重启进程
有时候只想简单的停止和重启进程。如下: 

kill -HUP PID 

该命令让Linux和缓的执行进程关闭,然后立即重启。在配置应用程序的时候,这个命令很方便,在对配置文件修改后需要重启进程时就可以执行此命令。

很多时候,会有人建议你,如果kill杀不掉一个进程,就用kill -9. 为什么? 
kill是Linux下常见的命令。其man手册的功能定义如下:

kill – send a signal to a process

明朗了,其实kill就是给某个进程id发送了一个信号。默认发送的信号是SIGTERM,而kill -9发送的信号是SIGKILL,即exit。exit信号不会被系统阻塞,所以kill -9能顺利杀掉进程。当然你也可以使用kill发送其他信号给进程。

Linux系统寻找和杀掉僵尸进程
Linux服务器上,多少会出现一些僵尸进程,下面介绍如何快速寻找和消灭这些僵尸进程的方法:

首先,可以使用top命令来查看服务器当前是否有僵尸进程,下图中可以看到僵尸进程的提示,如果数字大于0,那么意味着服务器当前存在僵尸进程:

下面,用ps 命令和 grep命令寻找僵尸进程:

ps -A -ostat,ppid,pid,cmd | grep -e '^[Zz]'

命令注解: 
-A 参数列出所有进程 
-o 自定义输出字段,我们设定显示字段为stat(状态),ppid(父进程pid),pid(进程pid),cmd(命令行)这四个参数

因为状态为 z 或者 Z的进程为僵尸进程,所以我们使用grep 抓取stat 状态为zZ进程;

运行结果如下所示:

Z 12334 12339 /path/cmd

这时,我们可以使用kill -HUP 12339 来杀掉这个僵尸进程;

运行后,在此运行ps -A -ostat,ppid,pid,cmd | grep -e '^[Zz]' 来确认是否将僵尸进程杀死;

如果kill 子进程的无效,可以尝试kill 其父进程来解决问题,例如上面父进程pid 为12334,那么我们就运行 kill -HUP 12334 来解决问题。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值