僵尸进程（Zombie）

不止Offer

已于 2023-03-08 20:06:17 修改

阅读量5.1k

点赞数

分类专栏： Linux网络编程文章标签：僵尸进程 wait waitpid

于 2023-03-07 23:54:30 首次发布

本文链接：https://blog.csdn.net/qq_42815188/article/details/129392190

版权

Linux网络编程专栏收录该内容

30 篇文章

订阅专栏

文章介绍了什么是僵尸进程，即在Unix系统中，子进程结束后但父进程未调用wait或waitpid函数处理导致的进程状态。僵尸进程占用系统资源，应当避免。通过拦截并处理SIGCHLD信号，使用wait或waitpid函数可以有效清理僵尸进程，避免其存在。示例代码展示了如何在C语言中实现这一过程。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1.僵尸进程

进程完成工作后（执行完 main 函数中的程序后）应被销毁，但有时这些进程将变成僵尸进程，占用系统中的重要资源。这种状态下的进程称作“僵尸进程”，这也是给系统带来负担的原因之一。我们应该消灭这种进程。当然应掌握正确的方法，否则它会死灰复燃。

从下图可以看到，父进程的 PID 是 1166，子进程的 PID 是 1167。

在这里插入图片描述

如果我们使用 kill -9 1167 命令将子进程干掉，观察父进程会收到什么信号？

从下图可以看到，父进程收到了 SIGCHLD 信号，子进程变成了僵尸进程。

在这里插入图片描述

在 Unix 系统中，一个子进程结束了，但是他的父进程还活着，但该父进程没有调用 wait()/waitpid() 函数来进行额外的处置，那么这个子进程就会变成一个僵尸进程。

僵尸进程已经被终止，不干活了，但是依旧没有被内核丢弃掉，因为内核认为父进程可能还需要该子进程的一些信息。作为开发者，坚决不允许僵尸进程的存在。

如何干掉僵尸进程？

重启电脑。
手动地把僵尸进程的父进程干掉，僵尸进程就会自动消失。
一个进程被终止或者停止时，SIGCHLD 信号会被发送给父进程，所以，对于源码中有 fork() 行为的进程，我们应该拦截并处理 SIGCHLD 信号。

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <signal.h>
#include <sys/wait.h>

// 信号处理函数
void sig_usr(int signo)
{
    int status;

    switch (signo)
    {
        case SIGUSR1:
            printf("收到了SIGUSR1信号，进程id=%d!\n", getpid());    
            break;
        
        case SIGCHLD:
            printf("收到了SIGCHLD信号，进程id=%d!\n", getpid());

            // waitpid()函数获取子进程的终止状态，这样子进程就不会成为僵尸进程了
            // 第一个参数为-1，表示等待任何子进程
            // 第二个参数保存子进程的状态信息
            // 第三个参数提供额外选项，WNOHANG表示不要阻塞，让这个waitpid()立即返回
            pid_t pid = waitpid(-1, &status, WNOHANG);

            if (pid == 0) return; // 子进程没结束，会立即返回这个数字
            if (pid == -1) return; // 这表示这个waitpid()调用有错误，有错误也立即返回出去
            return; // 走到这里，表示成功，那也return吧
            break;
    }
}

int main(int argc, char* const* argv)
{
    pid_t pid;

    printf("进程开始执行!\n");

    // 系统函数，第一个参数是个信号，第二个参数是个函数指针，代表一个针对该信号的捕捉处理函数
    if (signal(SIGUSR1, sig_usr) == SIG_ERR)
    {
        printf("无法捕捉SIGUSR1信号!\n");
        exit(1);
    }

    if (signal(SIGCHLD, sig_usr) == SIG_ERR)
    {
        printf("无法捕捉SIGCHLD信号!\n");
        exit(1);
    }

    pid = fork(); // 创建一个子进程

    // 要判断子进程是否创建成功
    if (pid < 0)
    {
        printf("子进程创建失败，很遗憾!\n");
        exit(1);
    }

    // 现在父进程和子进程同时开始运行了 
    for (;;)
    {
        sleep(1);
        printf("休息1秒，进程id=%d!\n", getpid());
    }

    printf("再见了!\n");

    return 0;
}

在这里插入图片描述

2.产生僵尸进程的原因

向 exit 函数传递的参数值和 main 函数的 return 语句返回的值都会传递给操作系统。而操作系统不会销毁子进程，直到把这些值传递给产生该子进程的父进程。处在这种状态下的进程就是僵尸进程。也就是说，将子进程变成僵尸进程的正是操作系统。

问：此僵尸进程何时被销毁呢？

答：应该向创建子进程的父进程传递子进程的 exit 参数值或 return 语句的返回值。

问：如何向父进程传递这些值呢？

答：操作系统不会主动把这些值传递给父进程。只有父进程主动发起请求（函数调用）时，操作系统才会传递该值。换言之，如果父进程未主动要求获得子进程的结束状态值，操作系统将一直保存，并让子进程长时间处于僵尸进程状态。也就是说，父母要负责收回自己生的孩子。

接下来的示例将创建僵尸进程。

#include <stdio.h>
#include <unistd.h>
#include <sys/types.h>

int main(int argc, char *argv[])
{
	pid_t pid = fork();
	
	if (pid == 0)    // if Child Process
	{
		puts("Hi, I am a child process");
	}
	else
	{
		// 输出子进程ID。可以通过该值查看子进程状态（是否为僵尸进程）。
		printf("Child Process ID: %d\n", pid);
		
		// 父进程暂停30秒。如果父进程终止，处于僵尸状态的子进程将同时销毁。因此，延缓父进程的执行以验证僵尸进程。
		sleep(30);    // Sleep 30 sec.
	}

	if (pid == 0)
		puts("End child process");
	else
		puts("End parent process");
	
	return 0;
}

编译运行：

gcc zombie.c -o zombie
./zombie

在这里插入图片描述

程序开始运行后，将在如上所示状态暂停。跳出这种状态前（30秒内），应验证子进程是否为僵尸进程，该验证在其他控制台窗口进行。

在这里插入图片描述

可以看出，PID 为 1387 的进程状态为僵尸进程（Z+）。另外，经过 30 秒的等待时间后，PID 为 1386 的父进程和 PID 为 1387 的僵尸子进程同时销毁。

3.利用 wait 函数销毁僵尸进程

如前所述，为了销毁子进程，父进程应主动请求获取子进程的返回值。

#include <sys/wait.h>

pid_t wait(int *statloc);

// 成功时返回终止的子进程ID，失败时返回-1

调用此函数时如果已有子进程终止，那么子进程终止时传递的返回值（exit 函数的参数值、main 函数的 return 返回值）将保存到该函数的参数所指内存空间。但函数参数指向的单元中还包含其他信息，因此需要通过下列宏进行分离：

WIFEXITED：子进程正常终止时返回“真”（true）。
WEXITSTATUS：返回子进程的返回值。

也就是说，向 wait 函数传递变量 status 的地址时，调用 wait 函数后应编写如下代码：

if (WIFEXITED(status))    // 是正常终止的吗？
{
    puts("Normal termination!");
    printf("Child pass num: %d", WEXITSTATUS(status));    // 那么返回值是多少？
}

根据上述内容编写如下示例，在下面示例中，不会再让子进程变成僵尸进程。

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <sys/wait.h>

int main(int argc, char *argv[])
{
	int status;

	// 第11行创建的子进程将在第15行通过main函数中的return语句终止。
	pid_t pid = fork();
	
	if (pid == 0)
	{
		return 3;
	}
	else
	{
		printf("Child PID: %d\n", pid);

		// 第22行中创建的子进程将在第26行通过调用exit函数终止。
		pid = fork();
		
		if (pid == 0)
		{
			exit(7);
		}
		else
		{
			printf("Child PID: %d\n", pid);
			
			// 调用wait函数。之前终止的子进程相关信息将保存到status变量，同时相关子进程被完全销毁。
			wait(&status);

			// 第36行中通过WIFEXITED宏验证子进程是否正常终止。如果正常退出，则调用WEXITSTATUS宏输出子进程的返回值。
			if (WIFEXITED(status))
				printf("Child send one: %d\n", WEXITSTATUS(status));
			
			// 因为之前创建了2个进程，所以再次调用wait函数和宏。
			wait(&status);
			
			if (WIFEXITED(status))
				printf("Child send two: %d\n", WEXITSTATUS(status));
			
			// 为暂停父进程终止而插入的代码。此时可以查看子进程的状态。
			sleep(30); // Sleep 30 sec.
		}
	}

	return 0;
}

编译运行：

gcc wait.c -o wait
./wait

输出结果：

在这里插入图片描述

可以看出，此时系统中并没有 PID 为 1497 和 1498 的进程，这是因为调用了 wait 函数，完全销毁了该子进程。另外，两个子进程终止时返回的 $3$ 和 $7$ 传递到了父进程。

这就是通过调用 wait 函数消灭僵尸进程的方法。调用 wait 函数时，如果没有已终止的子进程，那么程序将阻塞（Blocking）直到有子进程终止，因此要谨慎调用该函数。

4.使用 waitpid 函数销毁僵尸进程

wait 函数会引起程序阻塞，还可以考虑调用 waitpid 函数。这是防止僵尸进程的第二种方法，也是防止阻塞的方法。

#include <sys/wait.h>

pid_t waitpid(pid_t pid, int *statloc, int options);

// 成功时返回终止的子进程ID（或0），失败时返回-1
// pid：等待终止的目标子进程的ID，若传递-1，则与wait函数相同，可以等待任意子进程终止
// statloc：与wait函数的statloc参数具有相同含义
// options：传递头文件sys/wait.h中声明的常量WNOHANG，即使没有终止的子进程也不会进入阻塞状态，而是返回0并退出函数

下面介绍调用 waitpid 函数的示例。调用 waitpid 函数时，程序不会阻塞。

#include <stdio.h>
#include <unistd.h>
#include <sys/wait.h>

int main(int argc, char *argv[])
{
	int status;
	pid_t pid = fork();
	
	if (pid == 0)
	{
		// 调用sleep函数推迟子进程的执行。这会导致程序延迟15秒。
		sleep(15);
		return 24;
	}
	else
	{
		// while循环中调用waitpid函数。向第三个参数传递WNOHANG，因此，若之前没有终止的子进程将返回0。
		while (!waitpid(-1, &status, WNOHANG))
		{
			sleep(3);
			puts("sleep 3sec.");
		}

		if (WIFEXITED(status))
			printf("Child send %d\n", WEXITSTATUS(status));
	}

	return 0;
}