僵尸进程产生原因
在UNIX系统中,一个进程结束了,但是其父进程没有等待(调用wait/waitpid)它,那么它将变成一个僵尸进程。通过PS命令可以查看其带有defunct的标志,僵尸进程是一个早已死亡的进程,但在进程表中仍占据一个位置;
但是如果该进程的父进程已经先结束了,那么该进程就不会变成僵尸进程。因为每个进程结束的时候,系统都会扫描当前系统中所运行的所有进程,看看有没有哪个进程是刚刚结束的这个进程的子进程,如果是的话,就由init进程来接管他,成为他的父进程,从而保证每个进程都会有一个父进程。而init进程会自动wait其子进程,因此被Init接管的所有进程都不会变成僵尸进程。
一个进程在调用exit命令结束自己的生命时候,其实它没有真正的被销毁,而是留下一个称为僵尸进程的数据结构(系统调用exit,它的作用是使进程退出,但也仅仅限于将一个正常的进程变成一个僵尸进程,并不能将其完全销毁)。在Linux进程的状态中,僵尸进程是非常特殊的一种,它已经放弃了几乎所有的内存空间,没有任何可执行代码,也不能被调度,仅仅在进程列表中保留一个位置,记录在进程的退出状态等信息供其他进程收集,除此之外,僵尸进程不在占有任何内存空间。
它需要父进程来为它收尸…如果父进程结束了,那么init进程会自动接手这个子进程,为它收尸,它还是能被清除的,但是如果父进程是一个循环,不会结束,那么子进程就会一直保持僵尸状态,这就是为什么系统有时候会有很多的僵尸进程;
为什么windows不会有僵尸进程?
创建进程的方式在Windows(CreateProcess)和Linux(Fork)下的差异还是有的,但是也不是完全不能统一,麻烦点的就是Windows没有僵尸进程的概念导致进程ID不能真正区别出一个进程,比如说一个ID100的进程关闭了,然后一个新的进程启动后ID为100,并且父子进程之间的联系比Linux下要弱的多。
进程之间相互独立;要进行等待需要显式写代码。
查看僵尸进程
top>> task (line)>> zombie..
清除僵尸进程
把父进程杀掉,父进程死后,僵尸进程称为“孤儿进程”,过继给1号进程init,init始终负责清理僵尸进程,它产生的所有僵尸进程跟着消失;
kill
kill命令可以带信号号码选项,也可以不带。如果没有信号号码,kill命令就会发出终止信号(15)
killall kill -15 kill -9
一般都不能杀掉 defunct进程.. 用了kill -15,kill -9以后 之后反而会多出更多的僵尸进程
停止和重启进程
有时候只想简单的停止和重启进程。如下:
kill -HUP PID
该命令让Linux和缓的执行进程关闭,然后立即重启。在配置应用程序的时候,这个命令很方便,在对配置文件修改后需要重启进程时就可以执行此命令。
很多时候,会有人建议你,如果kill杀不掉一个进程,就用kill -9. 为什么?
kill是Linux下常见的命令。其man手册的功能定义如下:
kill – send a signal to a process
明朗了,其实kill就是给某个进程id发送了一个信号。默认发送的信号是SIGTERM,而kill -9发送的信号是SIGKILL,即exit。exit信号不会被系统阻塞,所以kill -9能顺利杀掉进程。当然你也可以使用kill发送其他信号给进程。
Linux系统寻找和杀掉僵尸进程
Linux服务器上,多少会出现一些僵尸进程,下面介绍如何快速寻找和消灭这些僵尸进程的方法:
首先,可以使用top命令来查看服务器当前是否有僵尸进程,下图中可以看到僵尸进程的提示,如果数字大于0,那么意味着服务器当前存在僵尸进程:
下面,用ps 命令和 grep命令寻找僵尸进程:
ps -A -ostat,ppid,pid,cmd | grep -e '^[Zz]'
命令注解:
-A 参数列出所有进程
-o 自定义输出字段,我们设定显示字段为stat(状态),ppid(父进程pid),pid(进程pid),cmd(命令行)这四个参数
因为状态为 z 或者 Z的进程为僵尸进程,所以我们使用grep 抓取stat 状态为zZ进程;
运行结果如下所示:
Z 12334 12339 /path/cmd
这时,我们可以使用kill -HUP 12339
来杀掉这个僵尸进程;
运行后,在此运行ps -A -ostat,ppid,pid,cmd | grep -e '^[Zz]'
来确认是否将僵尸进程杀死;
如果kill 子进程的无效,可以尝试kill 其父进程来解决问题,例如上面父进程pid 为12334,那么我们就运行 kill -HUP 12334
来解决问题;