文章目录基本概念危害僵尸进程测试解决僵尸进程问题wait函数参数status
基本概念
我们知道在unix/linux中,正常情况下,子进程是通过父进程创建的,子进程在创建新的进程。子进程的结束和父进程的运行是一个异步过程,即父进程永远无法预测子进程 到底什么时候结束。 当一个进程完成它的工作终止之后,它的父进程需要调用wait()或者waitpid()系统调用取得子进程的终止状态。
一个进程使用fork创建子进程,如果子进程退出,而父进程并没有调用wait或waitpid获取子进程的状态信息,那么子进程的进程描述符仍然保存在系统中。这种进程称之为僵尸进程,又称为“僵死进程”。
僵尸进程是当子进程比父进程先结束,而父进程又没有回收子进程,释放子进程占用的资源,此时子进程将成为一个僵尸进程。如果父进程先退出 ,子进程被init接管,子进程退出后init会回收其占用的相关资源.
危害
UNIX提供了一种机制可以保证只要父进程想知道子进程结束时的状态信息, 就可以得到。这种机制就是: 在每个进程退出的时候,内核释放该进程所有的资源,包括打开的文件,占用的内存等。 但是仍然为其保留一定的信息(包括进程号the process ID,退出状态the termination status of the process,运行时间the amount of CPU time taken by the process等)。直到父进程通过wait/waitpid来取时才释放。 但这样就导致了问题,如果进程不调用wait/waitpid的话, 那么保留的那段信息就不会释放,其进程号就会一直被占用,但是系统所能使用的进程号是有限的,如果大量的产生僵死进程,将因为没有可用的进程号而导致系统不能产生新的进程。 此即为僵尸进程的危害,应当避免。
僵尸进程测试
子进程比父进程先结束,且父进程未回收,则会产生僵尸进程:
#include
#include
#include
#include
#include
#include
int main()
{
int n = 0;
char * s = NULL;
pid_t pid = fork();
assert(pid != -1);
if(pid == 0)
{
n = 4;
s = "child";
}
else
{
n = 10;
s = "parent";
}
int i = 0;
for( ; i < n; i++)
{
printf("s = %s, curr_pid = %d, curr_ppid = %d\n",s,getpid(),getppid());
sleep(1);
}
exit(0);
}
父进程比子进程先结束,init接管子进程,不会产生僵尸进程:
#include
#include
#include
#include
#include
#include
int main()
{
int n = 0;
char * s = NULL;
pid_t pid = fork();
assert(pid != -1);
if(pid == 0)
{
n = 10;
s = "child";
}
else
{
n = 4;
s = "parent";
}
int i = 0;
for( ; i < n; i++)
{
printf("s = %s, curr_pid = %d, curr_ppid = %d\n",s,getpid(),getppid());
sleep(1);
}
exit(0);
}
解决僵尸进程问题
父进程调用wait();
父进程如果结束,init会成为子进程的父进程,然后init调用wait获取退出码,子进程便不会变成僵尸进程
代码实现:
#include
#include
#include
#include
#include
#include
int main()
{
int n = 0;
char * s = NULL;
pid_t pid = fork();
assert(pid != -1);
if(pid == 0)
{
n = 4;
s = "child";
}
else
{
n = 10;
s = "parent";
int val = 0;
pid_t id = wait(&val);
if(WIFEXITED(val))
{
printf("exit code = %d\n",WEXITSTATUS(val));
}
}
int i = 0;
for( ; i < n; i++)
{
printf("s = %s, curr_pid = %d, curr_ppid = %d\n",s,getpid(),getppid());
sleep(1);
}
exit(3); // 退出码设置为3
}
wait函数
wait的函数原型是:
#include /* 提供类型pid_t的定义 */
#include
pid_t wait(int *status)
进程一旦调用了wait,就立即阻塞自己,由wait自动分析是否当前进程的某个子进程已经退出,如果让它找到了这样一个已经变成僵尸的子进程****,wait就会收集这个子进程的信息,并把它彻底销毁后返回;如果没有找到这样一个子进程,wait就会一直阻塞在这里,直到有一个出现为止。
参数status用来保存被收集进程退出时的一些状态,它是一个指向int类型的指针。但如果我们对这个子进程是如何死掉的毫不在意,只想把这个僵尸进程消灭掉,(事实上绝大多数情况下,我们都会这样想),我们就可以设定这个参数为NULL,就像下面这样:
pid = wait(NULL);
如果成功,wait会返回被收集的子进程的进程ID,如果调用进程没有子进程,调用就会失败,此时wait返回-1,同时errno被置为ECHILD。
参数status
如果参数status的值不是NULL,wait就会把子进程退出时的状态取出并存入其中,这是一个整数值(int),指出了子进程是正常退出还是被非正常结束的(一个进程也可以被其他进程用信号结束,我们将在以后的文章中介绍),以及正常结束时的返回值,或被哪一个信号结束的等信息。由于这些信息被存放在一个整数的不同二进制位中,所以用常规的方法读取会非常麻烦,人们就设计了一套专门的宏(macro)来完成这项工作,下面是其中最常用的两个:
1、WIFEXITED(status) 这个宏用来指出子进程是否为正常退出的,如果是,它会返回一个非零值。
(请注意,虽然名字一样,这里的参数status并不同于wait唯一的参数–指向整数的指针status,而是那个指针所指向的整数)
2、WEXITSTATUS(status) 当WIFEXITED返回非零值时,我们可以用这个宏来提取子进程的返回值 ,如果子进程调用exit(5)退出,WEXITSTATUS(status)就会返回5;如果子进程调用exit(7),WEXITSTATUS(status)就会返回7。
请注意,如果进程不是正常退出的,也就是说,WIFEXITED返回0,这个值就毫无意义。