wait、waitpid及僵尸进程

一wait 父进程等待子进程结束

#include <sys/types.h> /* 提供类型pid_t的定义 */

#include <sys/wait.h>

pid_t wait(int *status)

进程一旦调用了wait,就立即阻塞自己,由wait自动分析是否当前进程的某个子进程已经退出,如果让它找到了这样一个已经变成僵尸的子进程,wait就会收集这个子进程的信息,并把它彻底销毁后返回;如果没有找到这样一个子进程,wait就会一直阻塞在这里,直到有一个出现为止。

参数status用来保存被收集进程退出时的一些状态,它是一个指向int类型的指针。但如果我们对这个子进程是如何死掉的毫不在意,只想把这个僵尸进程消灭掉,(事实上绝大多数情况下,我们都会这样想),我们就可以设定这个参数为NULL,就象下面这样:

pid = wait(NULL);

如果成功,wait会返回被收集的子进程的进程ID,如果调用进程没有子进程,调用就会失败,此时wait返回-1,同时errno被置为ECHILD。

wait调用例程:

/* wait1.c */

#include <sys/types.h>

#include <sys/wait.h>

#include <unistd.h>

#include <stdlib.h>

main()

{

        pid_t pc,pr;

        pc=fork();

 

        if(pc<0) /* 如果出错 */

               printf("error ocurred!/n");

       else if(pc==0){ /* 如果是子进程 */

               printf("This is child process with pid of %d/n",getpid());

              sleep(10); /* 睡眠10秒钟 */

            }

        else{ /* 如果是父进程 */

               pr=wait(NULL); /* 在这里等待 */

              printf("I catched a child process with pid of %d/n"),pr);

        }

       exit(0);

}

编译并运行:

$ gcc wait1.c -o wait1

$ ./wait1

This is child process with pid of 1508

I catched a child process with pid of 1508

可以明显注意到,在第2行结果打印出来前有10 秒钟的等待时间,这就是我们设定的让子进程睡眠的时间,只有子进程从睡眠中苏醒过来,它才能正常退出,也就才能被父进程捕捉到。其实这里我们不管设定子进程睡眠的时间有多长,父进程都会一直等待下去,读者如果有兴趣的话,可以试着自己修改一下这个数值,看看会出现怎样的结果。

参数status:

如果参数status的值不是NULL,wait就会把子进程退出时的状态取出并存入其中,这是一个整数值(int),指出了子进程是正常退出还是被非正常结束的(一个进程也可以被其他进程用信号结束,我们将在以后的文章中介绍),以及正常结束时的返回值,或被哪一个信号结束的等信息。由于这些信息被存放在一个整数的不同二进制位中,所以用常规的方法读取会非常麻烦,人们就设计了一套专门的宏(macro)来完成这项工作,下面我们来学习一下其中最常用的两个:

1、WIFEXITED(status) 这个宏用来指出子进程是否为正常退出的,如果是,它会返回一个非零值(请注意,虽然名字一样,这里的参数status并不同于wait唯一的参数---指向整数的指针status,而是那个指针所指向的整数,切记不要搞混了)

2、WEXITSTATUS(status) 当WIFEXITED返回非零值时,我们可以用这个宏来提取子进程的返回值,如果子进程调用exit(5)退出,WEXITSTATUS(status) 就会返回5;如果子进程调用exit(7),WEXITSTATUS(status)就会返回7。请注意,如果进程不是正常退出的,也就是说, WIFEXITED返回0,这个值就毫无意义。

下面通过例子来实战一下我们刚刚学到的内容:

/* wait2.c */

#include <sys/types.h>

#include <sys/wait.h>

#include <unistd.h>

main()

{

       int status;

       pid_t pc,pr;

       

        pc=fork();

        if(pc<0) /* 如果出错 */

               printf("error ocurred!/n");

        else if(pc==0){ /* 子进程 */

               printf("This is child process with pid of %d./n",getpid());

               exit(3); /* 子进程返回3 */

        }

        else{ /* 父进程 */

               pr=wait(&status);

               if(WIFEXITED(status)){ /* 如果WIFEXITED返回非零值 */

                       printf("the child process %d exit normally./n",pr);

                       printf("the return code is %d./n",WEXITSTATUS(status));

               }else /* 如果WIFEXITED返回零 */

                   printf("the child process %d exit abnormally./n",pr);

        }

}

编译并运行:

$ gcc wait2.c -o wait2

$ ./wait2

This is child process with pid of 1538.

the child process 1538 exit normally.

the return code is 3.

父进程准确捕捉到了子进程的返回值3,并把它打印了出来。

当然,处理进程退出状态的宏并不止这两个,但它们当中的绝大部分在平时的编程中很少用到,就也不在这里浪费篇幅介绍了,有兴趣的读者可以自己参阅Linux man pages去了解它们的用法。

进程同步:

有时候,父进程要求子进程的运算结果进行下一步的运算,或者子进程的功能是为父进程提供了下一步执行的先决条件(如:子进程建立文件,而父进程写入数据),此时父进程就必须在某一个位置停下来,等待子进程运行结束,而如果父进程不等待而直接执行下去的话,可以想见,会出现极大的混乱。这种情况称为进程之间的同步,更准确地说,这是进程同步的一种特例。进程同步就是要协调好2个以上的进程,使之以安排好地次序依次执行。解决进程同步问题有更通用的方法,我们将在以后介绍,但对于我们假设的这种情况,则完全可以用wait系统调用简单的予以解决。请看下面这段程序:

#include <sys/types.h>

#include <sys/wait.h>

main()

{

        pid_t pc, pr;

        int status;

 

        pc=fork();

 

       if(pc<0)

               printf("Error occured on forking./n");

        else if(pc==0){

                /* 子进程的工作 */

                exit(0);

        }else{

               /* 父进程的工作 */

               pr=wait(&status);

              /* 利用子进程的结果 */

        }

}

这段程序只是个例子,不能真正拿来执行,但它却说明了一些问题,首先,当fork调用成功后,父子进程各做各的事情,但当父进程的工作告一段落,需要用到子进程的结果时,它就停下来调用wait,一直等到子进程运行结束,然后利用子进程的结果继续执行,这样就圆满地解决了我们提出的进程同步问题。


进程退出方式

进程退出分为正常退出和异常退出两种:

(1)正常退出
a.在main函数中执行return
b.调用exit函数  stdlib.h中声明
c.调用_exit函数  unistd.h中声明
(2)异常退出
a.调用abort函数。
b.进程收到某个信号,而该信号使程序终止。

总结:不管是那种退出方式,最终都会执行内核中的同一段代码。这段代码用来关闭进程中所有打开的文件描述符,释放它所占用的内存和其他资源。



僵尸进程的产生

当一个进程创建了一个子进程时,他们的运行是异步的。即父进程无法预知子进程会在什么时候结束,那么如果父进程很繁忙来不及wait 子进程时,那么当子进程结束时,会不会丢失子进程结束时的状态信息呢?处于这种考虑unix提供了一种机制可以保证只要父进程想知道子进程结束时的信息,它就可以得到。

这种机制是:在每个进程退出的时候,内核释放该进程所有的资源,包括打开的文件,占用的内存。但是仍然保留了一些信息(如进程号pid 退出状态 运行时间等)。这些保留的信息直到进程通过调用wait/waitpid时才会释放。这样就导致了一个问题,如果没有调用wait/waitpid的话,那么保留的信息就不会释放。比如进程号就会被一直占用了。但系统所能使用的进程号的有限的,如果产生大量的僵尸进程,将导致系统没有可用的进程号进而导致系统不能创建进程。所以我们应该避免僵尸进程。

 

这里有一个需要注意的地方。如果子进程先结束而父进程后结束,即子进程结束后,父进程还在继续运行但是并未调用wait/waitpid那子进程就会成为僵尸进程。

 

但如果子进程后结束,即父进程先结束了,但没有调用wait/waitpid来等待子进程的结束,此时子进程还在运行,父进程已经结束。子进程就由init来接管。

 

同样的在产生僵尸进程的情况下,即子进程结束了但父进程还在继续运行(并未调用wait/waitpid)这段期间,假如父进程异常终止了,那么该子进程就会自动被init接管。僵尸进程将一直保留在进程表直到被init进程发现并释放。进程表越大,这个过程就会变得越慢,所以在init发现他们之前,僵尸进程依旧消耗着系统的资源。

 

 

我们先来讨论 父进程先结束的情况:

 

比如这段代码。我们让子进程循环打印5次语句 父进程循环打印3次语句。并在父进程中调用wait()等待子进程的结束//

  1. #include<stdio.h>  
  2. #include<stdlib.h>  
  3. #include<unistd.h>  
  4. #include<sys/types.h>  
  5. #include<sys/wait.h>  
  6. int main()  
  7. {  
  8.        int count;  
  9.        pid_t pid;  
  10.        char *message;   
  11.        printf("fork program starting\n");  
  12.    
  13.        pid=fork();  
  14.        switch(pid)  
  15.        {    
  16.                 case -1:perror("forkerror");  
  17.                         exit(EXIT_FAILURE);  
  18.                         break;  
  19.                 case 0 :message="This isthe children";  
  20.                         count=10;  
  21.                         break;  
  22.                 default:message="This isthe parent.";  
  23.                         count=3;  
  24.                         break;  
  25.         }    
  26.        for(;count>0;count--)  
  27.        {    
  28.                printf("%s\n",message);  
  29.                 sleep(1);  
  30.        }    
  31.        if(pid)  
  32.                 wait((int *)0);  
  33.        if(pid)  
  34.                 printf("Father programDone.\n");  
  35.        else  
  36.                 printf("Child ProgramDnoe\n");  
  37.        exit(0);  
  38.       
  39. }  
#include<stdio.h>
#include<stdlib.h>
#include<unistd.h>
#include<sys/types.h>
#include<sys/wait.h>
int main()
{
       int count;
       pid_t pid;
       char *message; 
       printf("fork program starting\n");
 
       pid=fork();
       switch(pid)
       {  
                case -1:perror("forkerror");
                        exit(EXIT_FAILURE);
                        break;
                case 0 :message="This isthe children";
                        count=10;
                        break;
                default:message="This isthe parent.";
                        count=3;
                        break;
        }  
       for(;count>0;count--)
       {  
               printf("%s\n",message);
                sleep(1);
       }  
       if(pid)
                wait((int *)0);
       if(pid)
                printf("Father programDone.\n");
       else
                printf("Child ProgramDnoe\n");
       exit(0);
    
}



我们让程序在后台运行,并用ps命令查看进程状态。

 

 

我们从输出中看到

第一行显示了我们运行的进程pid是27324

ps 的输出中我们看到了他有一个2735的子进程,

父进程循环三次后并不会结束,而是等待子进程结束后再结束。

这里并未产生僵尸进程。 

 

如果我们不等待子进程结束

if(pid) wait((int *)0)   注释掉

将产生如下输出

 

从第一行我们看到我们运行的程序pid为2804

ps输出中的pid为2805 是创建的子进程。我们是在父进程结束后(未调用wait,所以父进程先结束)再用ps命令查看的。所以2805的父进程变成了1 (init 的pid),因为2804已经结束了,所以2805这个子进程被 init接管,同样这里并未产生僵尸进程。

 

现在我们来分析子进程后结束的情况:

我们  给出下面这个程序

  1. #include<stdio.h>  
  2. #include<stdlib.h>  
  3. #include<unistd.h>  
  4. #include<sys/types.h>  
  5.    
  6. int main()  
  7. {  
  8.        int count;  
  9.        char *message;  
  10.        pid_t pid;  
  11.    
  12.        pid=fork();  
  13.        switch(pid)  
  14.        {    
  15.                 case -1:  
  16.                         perror("forkerror");  
  17.                         exit(EXIT_FAILURE);  
  18.                 case 0:message="This isthe child.";  
  19.                         count=5;  
  20.                         break;  
  21.                 default:message="This isth parent.";  
  22.                         count=10;  
  23.                        break;  
  24.        }    
  25.        for(;count>0;count--)  
  26.        {    
  27.                printf("%s\n",message);  
  28.                 sleep(2);  
  29.        }    
  30.    
  31.        if(pid)  
  32.                 printf("Father programDone.\n");  
  33.        else  
  34.                 printf("Child prigramDone\n");  
  35.        exit(EXIT_SUCCESS);  
  36.    
  37. }  
#include<stdio.h>
#include<stdlib.h>
#include<unistd.h>
#include<sys/types.h>
 
int main()
{
       int count;
       char *message;
       pid_t pid;
 
       pid=fork();
       switch(pid)
       {  
                case -1:
                        perror("forkerror");
                        exit(EXIT_FAILURE);
                case 0:message="This isthe child.";
                        count=5;
                        break;
                default:message="This isth parent.";
                        count=10;
                       break;
       }  
       for(;count>0;count--)
       {  
               printf("%s\n",message);
                sleep(2);
       }  
 
       if(pid)
                printf("Father programDone.\n");
       else
                printf("Child prigramDone\n");
       exit(EXIT_SUCCESS);
 
}


这里的代码改动很小,我们只是改变了父进程和子进程的 打印次数

并且在父进程中我们不调用wait/waitpid来释放子进程的一些信息

 

 

 在子进程结束,但父进程还未结束时我们查看进程信息

第一行我们看到 我们运行的程序pid 是2874,它的子进程我们可以从ps输出中看到为2875

 我们注意到pid为2875的进程这时候成了僵尸进程(defunct)。如果父进程运行的时间足够长,那么该僵尸进程就会一直存在着并占用着系统的一些资源。

 

我们已经知道僵尸进程的产生原因,那么如何避免僵尸进程呢

 

如果父进程并不是很繁忙我们就可以通过直接调用wait/waitpid来等待子进程的结束。当然这会导致父进程被挂起。比如第一种情况中(父进程循环了三次,子进程循环了五次,父进程先结束,父进程调用wait等待子进程)父进程循环结束后并不会结束,而是被挂起等待子进程的结束。

 

但是如果父进程很忙。我们不希望父进程一直被挂起直到子进程的结束。

那么我们可以使用信号函数sigaction为SIGCHLD设置wait处理函数。这样子进程结束后,父进程就会收到子进程结束的信号。并调用wait回收子进程的资源(pid)。

这里给出一个例程

 

  1. #include<sys/wait.h>  
  2. #include<stdio.h>  
  3. #include<stdlib.h>  
  4. #include<unistd.h>  
  5. #include<sys/types.h>  
  6. #include<signal.h>  
  7. void fun_act(int sig)  
  8. {  
  9.        wait((int *)0);  
  10. }  
  11. int main()  
  12. {  
  13.        int count;  
  14.        char *message;  
  15.        pid_t pid;  
  16.    
  17.        struct sigaction act;  
  18.        act.sa_handler=fun_act;  
  19.        sigemptyset(&act.sa_mask);  
  20.        act.sa_flags=0;  
  21.    
  22.        pid=fork();  
  23.        switch(pid)  
  24.        {    
  25.                 case -1:  
  26.                         perror("forkerror");  
  27.                         exit(EXIT_FAILURE);  
  28.    
  29.                 case 0:message="This isthe child.";  
  30.                         count=5;  
  31.                         break;  
  32.                              
  33.                 default:message="This isth parent.";  
  34.                         count=10;  
  35.                         break;  
  36.        }  
  37. if(pid)  
  38.                if(sigaction(SIGCHLD,&act,0)==-1)  
  39.                 {  
  40.                         perror("Settingsignal failed.");  
  41.                         exit(1);  
  42.                 }  
  43.        for(;count>0;count--)  
  44.        {  
  45.                printf("%s\n",message);  
  46.                 sleep(1);  
  47.        }  
  48.        if(pid)  
  49.                 printf("Father programDone.\n");  
  50.        else  
  51.                 printf("Child prigramDone\n");  
  52.        exit(EXIT_SUCCESS);  
  53.    
  54. }  
#include<sys/wait.h>
#include<stdio.h>
#include<stdlib.h>
#include<unistd.h>
#include<sys/types.h>
#include<signal.h>
void fun_act(int sig)
{
       wait((int *)0);
}
int main()
{
       int count;
       char *message;
       pid_t pid;
 
       struct sigaction act;
       act.sa_handler=fun_act;
       sigemptyset(&act.sa_mask);
       act.sa_flags=0;
 
       pid=fork();
       switch(pid)
       {  
                case -1:
                        perror("forkerror");
                        exit(EXIT_FAILURE);
 
                case 0:message="This isthe child.";
                        count=5;
                        break;
                           
                default:message="This isth parent.";
                        count=10;
                        break;
       }
if(pid)
               if(sigaction(SIGCHLD,&act,0)==-1)
                {
                        perror("Settingsignal failed.");
                        exit(1);
                }
       for(;count>0;count--)
       {
               printf("%s\n",message);
                sleep(1);
       }
       if(pid)
                printf("Father programDone.\n");
       else
                printf("Child prigramDone\n");
       exit(EXIT_SUCCESS);
 
}




我们在子进程结束前 用 ps 查看了一次,结束后也查看了一次。

从输出我们看到,pid为2949的子进程正常结束了,并未产生僵尸进程。说明子进程结束后,父进程收到了它结束的消息,并调用了wait回收了子进程的资源。从而避免了僵尸进程的产生。



二waitpid

waitpid系统调用在Linux函数库中的原型是:

#include <sys/types.h> /* 提供类型pid_t的定义 */

#include <sys/wait.h>

pid_t waitpid(pid_t pid,int *status,int options)

从本质上讲,系统调用waitpid和wait的作用是完全相同的,但waitpid多出了两个可由用户控制的参数pid和options,从而为我们编程提供了另一种更灵活的方式。下面我们就来详细介绍一下这两个参数:

pid:从参数的名字pid和类型pid_t中就可以看出,这里需要的是一个进程ID。但当pid取不同的值时,在这里有不同的意义。

         pid>0时,只等待进程ID等于pid的子进程,不管其它已经有多少子进程运行结束退出了,只要指定的子进程还没有结束,waitpid就会一直等下去。

         pid=-1时,等待任何一个子进程退出,没有任何限制,此时waitpid和wait的作用一模一样。

         pid=0时,等待同一个进程组中的任何子进程,如果子进程已经加入了别的进程组,waitpid不会对它做任何理睬。

         pid<-1时,等待一个指定进程组中的任何子进程,这个进程组的ID等于pid的绝对值。

options:options提供了一些额外的选项来控制waitpid,目前在Linux中只支持WNOHANG和WUNTRACED两个选项,这是两个常数,可以用"|"运算符把它们连接起来使用,比如:

ret=waitpid(-1,NULL,WNOHANG | WUNTRACED);

如果我们不想使用它们,也可以把options设为0,如:

ret=waitpid(-1,NULL,0);

如果使用了WNOHANG参数调用waitpid,即使没有子进程退出,它也会立即返回,不会像wait那样永远等下去。

而WUNTRACED参数,由于涉及到一些跟踪调试方面的知识,加之极少用到,这里就不多费笔墨了,有兴趣的读者可以自行查阅相关材料。

看到这里,聪明的读者可能已经看出端倪了:wait不就是经过包装的waitpid吗?没错,察看<内核源码目录>/include/unistd.h文件349-352行就会发现以下程序段:

static inline pid_t wait(int * wait_stat)

{

    return waitpid(-1,wait_stat,0);

}

返回值和错误

waitpid的返回值比wait稍微复杂一些,一共有3种情况:

          1、当正常返回的时候,waitpid返回收集到的子进程的进程ID;

          2、如果设置了选项WNOHANG,而调用中waitpid发现没有已退出的子进程可收集,则返回0;

          3、如果调用中出错,则返回-1,这时errno会被设置成相应的值以指示错误所在;

当pid所指示的子进程不存在,或此进程存在,但不是调用进程的子进程,waitpid就会出错返回,这时errno被设置为ECHILD;

/* waitpid.c */

#include <sys/types.h>

#include <sys/wait.h>

#include <unistd.h>

main()

{

        pid_t pc, pr;

 

        pc=fork();

        if(pc<0) /* 如果fork出错 */

               printf("Error occured on forking./n");

        else if(pc==0){ /* 如果是子进程 */

               sleep(10); /* 睡眠10秒 */

              exit(0);

        }

        /* 如果是父进程 */

       do{

               pr=waitpid(pc, NULL, WNOHANG); /* 使用了WNOHANG参数,waitpid不会在这里等待 */

               if(pr==0){ /* 如果没有收集到子进程 */

                  printf("No child exited/n");

                   sleep(1);

               }

        }while(pr==0); /* 没有收集到子进程,就回去继续尝试 */

        if(pr==pc)

               printf("successfully get child %d/n", pr);

        else

               printf("some error occured/n");

}

编译并运行:

$ cc waitpid.c -o waitpid

$ ./waitpid

No child exited

No child exited

No child exited

No child exited

No child exited

No child exited

No child exited

No child exited

No child exited

No child exited

successfully get child 1526

父进程经过10次失败的尝试之后,终于收集到了退出的子进程。

因为这只是一个例子程序,不便写得太复杂,所以我们就让父进程和子进程分别睡眠了10秒钟和1秒钟,代表它们分别作了10秒钟和1秒钟的工作。父子进程都有工作要做,父进程利用工作的简短间歇察看子进程的是否退出,如退出就收集它。

提示:可以尝试在最后一个例子中把pr=waitpid(pc, NULL, WNOHANG); 改为pr=waitpid(pc, NULL, 0);或者pr=wait(NULL);看看运行结果有何变化?(修改后的结果使得父进程将自己阻塞,直到有子进程退出为止!)




  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值