#include <sys/wait.h>
#include <sys/types.h>
pid_t waitpid(pid_t pid, int *status, int options);
作用:同wait,但可指定pid进程清理,可以不阻塞。
waitpid函数的第二个参数int *status跟wait函数的形参一样,且都是利用相同的宏函数来进一步获取结束进程的状态和终止原因。
第一个形参pid:>0,则回收指定参数(pid)的PID进程;=-1,则回收该父进程的任意一个子进程,相当于wait函数;=0,则回收和当前调用waitpid函数一个组的任意子进程(即跟父进程在同一个组的所有子进程);<-1,则回收指定进程组内的任意子进程。因此,-1的范围最大,所有子进程;其次是小于-1和0,最后是指定具体的子进程。注意,wait函数和waitpid函数只能回收父进程自己的子进程,且一次wait或waitpid调用只能清理一个子进程,清理多个子进程应使用循环。在默认情况下,父进程fork后产生的子进程跟父进程在同一个进程组,因此参数为0时,在这种情况下,相当于回收fork产生的所有子进程。
再次强调:一次wait或waitpid调用只能回收一个子进程,如果回收的是多个子进程,则哪一个子进程先结束,则回收哪一个。如果都回收,则可以采用循环(for、while、do while等)。
第三个参数options:为0,则代表阻塞等待子进程结束,再回收,跟wait一样;为WNOHANG,则不再等待,如果要回收的子进程都在运行,则直接返回0,然后接着执行后续程序;为WUNTRACED,如果子进程由于被停止产生的SIGCHLD,waitpid则立即返回;为WCONTINUED,如果子进程由于被SIGCONT唤醒而产生的SIGCHLD,waitpid则立即返回。
对于waitpid的返回值:如果没有子进程或其它错误原因,则返回-1;如果成功回收子进程,则返回回收的那个子进程的ID;如果第三个参数为WNOHANG,且子进程都在运行,则返回0。
因此:waitpid( -1, NULL,0) 与 wait( NULL )是等效的,都是阻塞等待回收所有子进程。
//代码
#include <unistd.h>
#include <stdlib.h>
#include <stdio.h>
#include <sys/wait.h>
int main(void)
{
pid_t pid, pid2, wpid;
int flg = 0;
pid = fork();
pid2 = fork(); //此时总共有4个进程(不包括shell)
if(pid == -1){
perror("fork error");
exit(1);
} else if(pid == 0){ //注意:pid=0的进程有两个,子进程和子进程的子进程
printf("I'm process child, pid = %d\n", getpid());
sleep(5);
exit(4);
} else { //注意:pid>0的进程有两个,父进程和子进程
do {
wpid = waitpid(pid, NULL, WNOHANG);
printf("---wpid = %d--------%d\n", wpid, flg++);
if(wpid == 0){
printf("NO child exited\n");
sleep(1);
}
} while (wpid == 0); //子进程不可回收
if(wpid == pid){ //回收了指定子进程
printf("I'm parent, I catched child process,"
"pid = %d\n", wpid);
} else {
printf("other...\n");
}
}
return 0;
}
[root@localhost wait]# ./waitpid
---wpid = 0--------0
NO child exited
I'm process child, pid = 33493
---wpid = -1--------0
I'm process child, pid = 33495
other...
---wpid = 0--------1
NO child exited
---wpid = 0--------2
NO child exited
---wpid = 0--------3
NO child exited
---wpid = 0--------4
NO child exited
---wpid = 33493--------5
I'm parent, I catched child process,pid = 33493
//代码:阻塞回收一个子进程
#include <unistd.h>
#include <stdlib.h>
#include <sys/wait.h>
#include <sys/types.h>
int main(int argc, char *argv[])
{
int n = 5, i; //默认创建5个子进程
pid_t p, q;
if(argc == 2) {
n = atoi(argv[1]); //将字符串转化为整数
}
for(i = 0; i < n; i++) {//出口1,父进程专用出口
p = fork();
if(p == 0)
break; //出口2,子进程出口,i不自增
else if (i == 3){
q = p; //将第4个子进程的ID保存在q中
}
}
if(n == i){
sleep(n);
printf("I am parent, pid = %d\n", getpid());
pid_t pid = waitpid(-1,NULL,0); //等价于 pid_t pid = wait(NULL);
if( pid == -1)
{
perror("waitpid");
exit(1);
}
while(1); //让父进程陷入死循环,防止子进程被init回收
} else {
sleep(i);
printf("I'm %dth child, pid = %d\n", i+1, getpid());
}
return 0;
}
//代码:阻塞回收指定的进程(第4个子进程)
if(n == i){
sleep(n);
printf("I am parent, pid = %d\n", getpid());
//pid_t pid = waitpid(-1,NULL,0); //等价于 pid_t pid = wait(NULL);
pid_t pid = waitpid(q,NULL,0);
if( pid == -1)
{
perror("waitpid");
exit(1);
}
while(1); //让父进程陷入死循环,防止子进程被init回收
} else {
sleep(i);
printf("I'm %dth child, pid = %d\n", i+1, getpid());
}
//代码:阻塞回收所有的子进程
if(n == i){
sleep(n);
printf("I am parent, pid = %d\n", getpid());
//pid_t pid = waitpid(-1,NULL,0); //等价于 pid_t pid = wait(NULL);
//pid_t pid = waitpid(q,NULL,0);
while(waitpid(-1,NULL,0)); // 等价于while(wait(NULL));
while(1); //让父进程陷入死循环,防止子进程被init回收
认回收
} else {
sleep(i);
printf("I'm %dth child, pid = %d\n", i+1, getpid());
}
//代码:非阻塞(WNOHANG)回收所有的子进程
if(n == i){
sleep(n);
printf("I am parent, pid = %d\n", getpid());
//pid_t pid = waitpid(-1,NULL,0); //等价于 pid_t pid = wait(NULL);
//pid_t pid = waitpid(q,NULL,0);
//while(waitpid(-1,NULL,0)); // 等价于while(wait(NULL));
do{
pid_t pid = waitpid(-1,NULL,WNOHANG);
if ( pid > 0 )
n--;
}while( n > 0 )
while(1); //让父进程陷入死循环,防止子进程被init回收
} else {
sleep(i);
printf("I'm %dth child, pid = %d\n", i+1, getpid());
}
[root@localhost wait]# ps aux
root 34224 57.1 0.0 4164 356 pts/0 R+ 22:58 0:06 ./loop_fork
root 34230 0.0 0.0 123360 1380 pts/2 R+ 22:58 0:00 ps aux
可以看到,所有子进程都被回收,没有僵尸进程。
当第一个参数为-1时,为指定进程组:
[root@localhost wait]# ps ajx
PPID PID PGID SID TTY TPGID STAT UID TIME COMMAND
0 2 0 0 ? -1 S 0 0:00 [kthreadd]
ps ajx指令:PPID为父进程ID;PID为进程ID;PGID为进程组ID。SID为会话ID。
[root@localhost wait]# cat | cat | cat | cat //执行这个命令,然后查看进程组ID
[root@localhost wait]# ps ajx
29904 34326 34326 29904 pts/0 34326 S+ 0 0:00 cat
29904 34327 34326 29904 pts/0 34326 S+ 0 0:00 cat
29904 34328 34326 29904 pts/0 34326 S+ 0 0:00 cat
29904 34329 34326 29904 pts/0 34326 S+ 0 0:00 cat
可以看到这四个进程的进程组ID都一样,属于同一个进程组,为34326。因此要回收这四个子进程,第一个参数为:-34326。 要杀死这四个进程: kill -34326或kill -9 -34326
练习作业:父进程fork 3 个子进程,三个子进程一个调用ps命令, 一个调用自定义程序1(正常),一个调用自定义程序2(会出段错误)。父进程使用waitpid对其子进程进行回收,并指出其状态和退出的原因。