《Linux系统编程篇》fork/wait/waitpid/exit函数——基础篇

原创已于 2024-11-01 17:36:38 修改 · 1.5k 阅读

28 ·

CC 4.0 BY-SA版权

文章标签：

#linux #c语言

于 2024-10-28 19:40:42 首次发布

从0开始学linux 同时被 2 个专栏收录

22 篇文章

订阅专栏

linux系统编程

13 篇文章

订阅专栏

文章目录

引言
fork() 函数概述
- 父子进程
- 兄弟进程
fork函数
- fork() 的常见问题
- fork() 的优势与限制
引入`wait`和`waitpid`（解决僵尸进程）
结论

命为志存。 —— 朱熹

引言

《Linux系统编程篇》——基础篇首页传送门

本节我们正式进入Linux的进程代码编写。

fork() 是 Unix 系统中一个重要的系统调用，用于创建一个新的进程。它是创建进程的核心函数之一，其特性和用法在进程管理中至关重要。本文将带你深入了解 fork() 函数的使用、返回值、常见问题及其在操作系统中的重要性。

fork() 函数概述

在 Linux 中，所有的进程都是通过 fork() 派生而来。当一个进程调用 fork() 时，操作系统会复制当前进程的上下文，为它创建一个几乎完全相同的副本，这个副本被称为子进程，而原始进程被称为父进程。

这也是人们口中的父子进程的概念

父子进程

进程a->fork->进程b

我们称作进程a是进程b的父进程，反之进程b则是进程a的子进程

兄弟进程

进程a->fork->进程b
进程a->fork->进程c

我们称作进程b和进程c互为兄弟进程，进程a则是他们共同的父亲

fork函数

我们在命令终端，可以轻易的使用man手册来看，这个函数的作用返回值等，以及这个函数所需要的头文件是什么。

man 2 fork

fork() 是一个在Unix系统中可用的系统调用函数，用于创建一个新的进程。

fork() 函数的原型如下：

#include <unistd.h>

pid_t fork(void);

fork() 函数在调用时会复制当前进程创建一个新的子进程。子进程将几乎完全复制父进程的状态，包括代码、数据、打开的文件等。父进程和子进程之间的唯一区别是进程 ID（PID）和返回值。

如果 fork() 返回 -1，则表示创建子进程失败。
如果 fork() 返回 0，则表示当前代码运行在子进程中。
如果 fork() 返回一个正整数，表示当前代码运行在父进程中，并且返回的值是子进程的PID。

好，接着我们写一段调用fork函数的一个小demo

#include <stdio.h>
#include <sys/types.h>
#include <unistd.h>

int main()
{
        pid_t pid;
        
        pid = fork();

        printf("pid = %d\n",pid);
        return 0;
}

在这里插入图片描述

编译运行后可以看到我的pid被打印了两次，也就是说我的printf函数被执行了两次。

结合我们提前整理的资料来看，使用fork之后返回的pid，一个是3403，一个是0，那么输出是0的这个应该是子进程打印的，那么另一个则是我的父进程打印的，这一区别使父子进程能够在相同的代码段内执行不同的操作。

例如，父进程可以根据 fork() 的返回值来监控子进程的运行状态，而子进程则可以独立执行任务。

我们升级这个程序继续观察一下。

#include <stdio.h>
#include <sys/types.h>
#include <unistd.h>

int main()
{
	pid_t pid;
       
	printf("*********  test log 01 **********\n");

    pid = fork();
	printf("pid = %d\n",pid);
	
	if(pid == 0){
		printf("this is child\n");
		while(1){usleep(500);}
	}else{
		printf("this is father\n");
		while(1){usleep(500);}
	}


	return 0;
}

在这里插入图片描述
代码解释：
当 fork() 被调用时，系统会创建一个新进程。
代码中，pid 是 fork() 的返回值，如果 pid == 0 表示这是子进程，否则就是父进程。
父进程可以通过 wait() 函数等待子进程执行完成。

这次在fork之前加了打印，可见在调用fork之前，我们的代码还是单进程再跑的。在fork之后也做了相关的判断，看到这里我想大家应该掌握了进程的奥秘了。

于是我们总结一下，写一个进程小框架，方便日后便捷使用。

#include <stdio.h>
#include <unistd.h>

int main() {
    pid_t pid = fork();

    if (pid == -1) {
        // 创建子进程失败
        perror("fork failed");
    } else if (pid == 0) {
        // 子进程代码
        printf("Hello from child process!\n");
    } else {
        // 父进程代码
        printf("Hello from parent process!\n");
        printf("Child process ID: %d\n", pid);
    }

    return 0;
}

到了这里恭喜你，学会了进程，剩下的一些骚操作就是在此基础上不断的扩展延伸，以及迭代。
但是请注意
当一个进程调用fork()创建一个子进程时，子进程会复制父进程的内存空间，包括代码段、数据段、堆和栈等。这意味着在刚刚创建时，父进程和子进程的内存是一样的，但在后续的运行过程中，它们的内存是相互独立的。

现代操作系统中为了提高效率，通常使用写时复制（Copy-On-Write，COW ）技术。

写时复制（Copy-On-Write，COW ）
这意味着在 fork() 后，父子进程共享相同的内存页，直到其中一个进程试图修改这些页时，操作系统才会真正复制这些页。这样可以显著减少内存的占用，优化性能。

fork() 的常见问题

僵尸进程（Zombie Process）：如果父进程在子进程结束后未调用 wait() 或 waitpid() 函数读取子进程的状态信息，子进程将成为僵尸进程。这会占用系统资源，导致系统无法创建新的进程。
多次 fork()：如果不慎多次调用 fork()，可能会产生大量子进程，消耗系统资源，甚至造成“fork 炸弹”（即创建太多进程导致系统资源耗尽，系统崩溃）。
COW 效率：尽管写时复制提高了效率，但在高负载情况下，COW 的性能可能会受限。

Copy-On-Write（COW）是一种内存管理技术，通常用于优化进程之间的内存共享和复制操作。在 COW 机制中，当多个进程共享同一块内存时，只有在其中一个进程尝试修改这块内存时，系统才会执行复制操作，确保每个进程都能看到自己的独立副本，从而实现了延迟复制的效果。
COW 的效率主要体现在以下几个方面：

节省内存开销：COW 允许多个进程共享同一块内存，避免了不必要的内存复制。只有在必要的时候才会进行复制，从而节省内存开销。
减少复制时间：由于只有在写入操作时才会执行复制，因此在大多数情况下，COW 可以减少复制所需的时间，提高了操作的效率。
提高性能：通过延迟复制操作，COW 可以提高程序的性能，特别是在需要频繁复制内存数据的情况下，避免了不必要的复制开销。

fork() 的优势与限制

优势：fork() 是创建子进程的简单方式，适合多任务并行处理的应用场景。写时复制机制降低了资源消耗，提升了系统效率。
限制：在资源受限的嵌入式系统或实时系统中，频繁使用 fork() 可能导致性能下降。此外，不恰当的 fork() 使用可能引发僵尸进程或系统资源耗尽等问题。

引入`wait`和`waitpid`（解决僵尸进程）

除了fork之外我们如何检测子进程的结束状态呢，换言之，我想让子进程帮我办个事，办完事之后我想让他和我反馈一下，有没有这样一个函数，可以检测它的反馈并做处理呢，当然有那就是wait和waitpid

wait 和 waitpid 函数用于等待子进程的结束，并获取子进程的终止状态。父进程可以通过这些函数来等待子进程的退出，以避免僵尸进程的产生。

wait函数

wait 函数用于父进程等待其子进程的结束。当子进程结束时，父进程将从 wait 函数中返回，并获取子进程的终止状态以及退出原因。如果子进程尚未结束，父进程将阻塞直到子进程退出。

当子进程结束时，父进程将从wait调用中返回，并获取子进程的终止状态以及退出原因。

status参数是一个整型指针，用于存储子进程的退出状态。如果父进程不关心子进程的退出状态，可以将status设置为NULL。

wait系统调用的工作原理如下：

pid_t wait(int *status);

如果当前进程没有子进程，wait会立即返回-1并设置errno为ECHILD。
如果有子进程正在运行，父进程将被阻塞，直到其中一个子进程终止。
当子进程终止时，wait会返回子进程的PID，同时将子进程的退出状态存储在status指向的位置。
父进程可以通过检查status来确定子进程的退出状态，通常通过WIFEXITED(status)和WEXITSTATUS(status)来获取子进程的退出状态值。

例子（wait 系统调用的基本用法）：

#include <stdio.h>
#include <stdlib.h>
#include <sys/types.h>
#include <sys/wait.h>
#include <unistd.h>

int main() {
    pid_t pid = fork();

    if (pid == 0) {
        // 子进程
        printf("子进程正在运行\n");
        sleep(2); // 模拟子进程执行任务
        exit(42); // 子进程退出，退出状态为42
    } else if (pid > 0) {
        // 父进程
        printf("父进程正在等待子进程\n");
        int status;
        wait(&status); // 等待子进程结束
        if (WIFEXITED(status)) {
            printf("子进程退出，退出状态为: %d\n", WEXITSTATUS(status));
        }
    } else {
        perror("fork");
        exit(1);
    }

    return 0;
}

运行结果:
在这里插入图片描述

父进程通过wait等待子进程结束，并获取子进程的退出状态。通过这种方式，父子进程之间可以进行协同工作和信息交换。

waitpid函数：

与 wait 类似，但具有更灵活的功能。waitpid 允许父进程指定要等待的子进程的 PID，从而可以选择性地等待某个特定的子进程退出，而不是等待任何子进程。

pid_t waitpid(pid_t pid, int *status, int options);

pid 参数用于指定要等待的子进程的 PID，具体取值如下：
- 如果 pid 大于 0，则等待具有指定 PID 的子进程。
- 如果 pid 等于 -1，则等待任意子进程。
- 如果 pid 等于 0，则等待与调用进程在同一个进程组的任意子进程。
- 如果 pid 小于 -1，则等待进程组 ID 等于 pid 绝对值的任意子进程。
status 参数是一个整型指针，用于存储子进程的退出状态。
options 参数用于指定一些选项，如是否非阻塞等。

例子（waitpid 系统调用的基本用法）：

#include <stdio.h>
#include <stdlib.h>
#include <sys/types.h>
#include <sys/wait.h>
#include <unistd.h>

int main() {
    pid_t pid = fork();

    if (pid == 0) {
        // 子进程
        printf("子进程正在运行\n");
        sleep(2); // 模拟子进程执行任务
        exit(42); // 子进程退出，退出状态为42
    } else if (pid > 0) {
        // 父进程
        printf("父进程正在等待子进程\n");
        int status;
        pid_t child_pid = waitpid(pid, &status, 0); // 等待特定子进程结束
        if (child_pid == -1) {
            perror("waitpid");
            exit(1);
        }
        if (WIFEXITED(status)) {
            printf("子进程 %d 退出，退出状态为: %d\n", child_pid, WEXITSTATUS(status));
        }
    } else {
        perror("fork");
        exit(1);
    }

    return 0;
}

父进程使用 waitpid 指定要等待的子进程的 PID，以等待特定的子进程结束并获取其退出状态。通过 waitpid，父进程可以更精确地控制对子进程的等待。

运行结果:
在这里插入图片描述

exit函数

exit 函数用于终止当前进程的执行，并返回一个状态码给父进程。当进程执行完毕时，应该调用 exit 函数来正常退出，以避免产生僵尸进程。

void exit(int status);

status 参数是一个整型值，用于表示进程的退出状态。通常情况下，0 表示正常退出，而其他非零值则表示异常退出，可以用于指示具体的错误码或其他信息。

在上述例子中我们有调用到这个函数，这个函数就是的作用就是：

当调用 exit 函数时，当前进程会立即终止，并返回一个整型值作为退出状态码。这个退出状态码通常用来表示程序的结束状态，可以被父进程或操作系统获取。

上一个例子当中我们调用了exit这个函数并返回了状态码为42，并被父进程的waitpid接收到。

结论

fork() 是 Linux 系统中关键的系统调用，理解它的行为和特性是掌握 Linux 进程管理的关键一步。掌握 fork() 的用法和注意事项，可以帮助开发者设计出高效、健壮的多进程应用。在实际开发中，fork() 通常与 exec、wait 等函数配合使用，以满足多任务系统的要求。