僵尸进程

最新推荐文章于 2015-04-24 13:18:11 发布

zj19880814

最新推荐文章于 2015-04-24 13:18:11 发布

阅读量111

点赞数

分类专栏： python 服务端编程文章标签：运维操作系统数据结构与算法

本文链接：https://blog.csdn.net/zj19880814/article/details/84463988

版权

python 服务端编程专栏收录该内容

21 篇文章 0 订阅

订阅专栏

参考文档：

http://linuxme.blog.51cto.com/1850814/351133

http://www.lupaworld.com/article-216737-1.html

僵尸进程

当一个进程结束时，linux系统将产生一个SIGCHLD信号通知其父进程.

可能很少有人意识到，在一个进程调用了exit之后，该进程并非马上就消失掉，而是留下一个称为僵尸进程（Zombie）的数据结构。在Linux进程的5种状态中，僵尸进程是非常特殊的一种，它已经放弃了几乎所有内存空间，没有任何可执行代码，也不能被调度，仅仅在进程列表中保留一个位置，记载该进程的退出状态等信息供其他进程收集，除此之外，僵尸进程不再占有任何内存空间。

僵尸进程的来由，要追溯到Unix，Unix的设计者们设计这个东西并非是因为闲来无事想装装酷什么的。上面说到，僵尸进程中保存着很多对程序员和系统管理员非常重要的信息，首先，这个进程是怎么死亡的？是正常退出呢，还是出现了错误，还是被其它进程强迫退出的？也就是说，这个程序的退出码是什么？其次，这个进程占用的总系统CPU时间和总用户CPU时间分别是多少？发生页错误的数目和收到信号的数目。这些信息都被存储在僵尸进程中，试想如果没有僵尸进程，进程执行多长我们并不知道，一旦其退出，所有与之相关的信息都立刻都从系统中清除，而如果此时父进程或系统管理员需要用到，就只好干瞪眼了。

所以，进程退出后，系统会把该进程的状态变成Zombie，然后给上一定的时间等着父进程来收集其退出信息，因为可能父进程正忙于别的事情来不及收集，所以，使用Zombie状态表示进程退出了，正在等待父进程收集信息中。

Zombie进程不可以用kill命令清楚，因为进程已退出，如果需要清除这样的进程，那么需要清除其父进程，或是等很长的时间后被内核清除。因为 Zombie的进程还占着个进程ID号呢，这样的进程如果很多的话，不利于系统的进程调度。

下面，让我们来看看一个示例：

01 /* zombie.c */

02 #include <sys/types.h>

03 #include <unistd.h> main()

04 {

05 pid_t pid;

06 pid=fork();

07 if(pid<0) { /* 如果出错 */

08 printf(error occurred! );

09 }else if(pid==0){ /* 如果是子进程 */

10 exit(0);

11 }else{ /* 如果是父进程 */

12 sleep(60); /* 休眠60秒 */

13 wait(NULL); /* 收集僵尸进程 */

14 }

15 }

编译这个程序：

1 $ cc zombie.c -o zombie

后台运行程序，以使我们能够执行下一条命令

1 $ ./zombie &

2 [1] 1217

列一下系统内的进程

1 $ ps -ax

2 ... ...

3 1137 pts/0 S 0:00 -bash

4 1217 pts/0 S 0:00 ./zombie

5 1218 pts/0 Z 0:00 [zombie]

6 1578 pts/0 R 0:00 ps -ax

其中的”Z”就是僵尸进程的标志，它表示1218号进程现在就是一个僵尸进程。

收集Zombie进程的信息，并终结这些僵尸进程，需要我们在父进程中使用waitpid调用和wait调用。这两者的作用都是收集僵尸进程留下的信息，同时使这个进程彻底消失。

----------------------------------------------------------------------------------------------------------

Linux的僵尸进程及其解决方法

　　1. 产生原因：

　　在UNIX 系统中，一个进程结束了，但是他的父进程没有等待(调用wait / waitpid)他，那么他将变成一个僵尸进程。通过ps命令查看其带有defunct的标志。僵尸进程是一个早已死亡的进程，但在进程表(processs table)中仍占了一个位置(slot)。

　　但是如果该进程的父进程已经先结束了，那么该进程就不会变成僵尸进程。因为每个进程结束的时候，系统都会扫描当前系统中所运行的所有进程，看看有没有哪个进程是刚刚结束的这个进程的子进程，如果是的话，就由Init进程来接管他，成为他的父进程，从而保证每个进程都会有一个父进程。而Init进程会自动wait其子进程，因此被Init接管的所有进程都不会变成僵尸进程。

　　2. 原理分析：

　　每个Unix进程在进程表里都有一个进入点(entry)，核心进程执行该进程时使用到的一切信息都存储在进入点。当用 ps 命令察看系统中的进程信息时，看到的就是进程表中的相关数据。当以fork()系统调用建立一个新的进程后，核心进程就会在进程表中给这个新进程分配一个进入点，然后将相关信息存储在该进入点所对应的进程表内。这些信息中有一项是其父进程的识别码。

　　子进程的结束和父进程的运行是一个异步过程，即父进程永远无法预测子进程到底什么时候结束。那么会不会因为父进程太忙来不及 wait 子进程，或者说不知道子进程什么时候结束，而丢失子进程结束时的状态信息呢？不会。因为UNIX提供了一种机制可以保证，只要父进程想知道子进程结束时的状态信息，就可以得到。这种机制就是：当子进程走完了自己的生命周期后，它会执行exit()系统调用，内核释放该进程所有的资源，包括打开的文件，占用的内存等。但是仍然为其保留一定的信息(包括进程号the process ID，退出码exit code，退出状态the terminationstatus of the process，运行时间the amount of CPU time taken by the process等)，这些数据会一直保留到系统将它传递给它的父进程为止，直到父进程通过wait / waitpid来取时才释放。

　　3.解决方法：

　　(1) 父进程通过wait和waitpid等函数等待子进程结束，这会导致父进程挂起。

　　执行wait()或waitpid()系统调用，则子进程在终止后会立即把它在进程表中的数据返回给父进程，此时系统会立即删除该进入点。在这种情形下就不会产生defunct进程。

　　(2) 如果父进程很忙，那么可以用signal函数为SIGCHLD安装handler。在子进程结束后，父进程会收到该信号，可以在handler中调用wait回收。

　　(3) 如果父进程不关心子进程什么时候结束，那么可以用signal(SIGCLD, SIG_IGN)或signal(SIGCHLD, SIG_IGN)通知内核，自己对子进程的结束不感兴趣，那么子进程结束后，内核会回收，并不再给父进程发送信号

　　(4)fork两次，父进程fork一个子进程，然后继续工作，子进程fork一个孙进程后退出，那么孙进程被init接管，孙进程结束后，init会回收。不过子进程的回收还要自己做。

zj19880814

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
僵尸进程

参考文档：http://linuxme.blog.51cto.com/1850814/351133http://www.lupaworld.com/article-216737-1.html 僵尸进程当一个进程结束时，linux系统将产生一个SIGCHLD信号通知其父进程. 可能很少有人意识到，在一个进程调用了exit之后，该进程并非马上就消失掉，而是留下一个...
复制链接

扫一扫

专栏目录