Linux fork() 和 vfork()

Ruo_Xiao

已于 2022-08-07 08:06:47 修改

阅读量160

点赞数

分类专栏： OS / Linux 文章标签： linux c++ 运维

于 2020-02-20 09:23:37 首次发布

原文链接：https://blog.csdn.net/OOC_ZC/article/details/90341104

版权

OS / Linux 专栏收录该内容

134 篇文章 25 订阅

订阅专栏

一、概述

fork 和 vfork 都是用来创建一个子进程的。

区别：

fork() 子进程拷贝父进程的数据段和代码段，这里通过拷贝页表实现。vfork() 子进程与父进程共享地址空间，无需拷贝页表，效率更高。
fork() 父子进程的执行次序不确定。vfork() 保证子进程先运行，在调用 exec 或 exit 之前与父进程数据是共享的。父进程在子进程调用 exec 或 exit 之后才可能被调度运行，如果在调用这两个函数之前子进程依赖于父进程的进一步动作，则会导致死锁。

一、fork()

当 fork 函数被当前函数调用时，内核为新进程创建各种数据结构，并分配给它一个唯一的 PID。为了给这个新进程创建虚拟内存，它创建了当前进程的 mm_struct，区域结构和页表的原样副本，并将两个进程中的每个区域结构都标记为私有的写时复制。

当 fork 在新进程中返回时，新进程现在的虚拟内存刚好和调用fork时存在的虚拟内存相同。当这两个进程中的任一个后来进行写操作时，写时复制机制就会创建新页面。因此，也就为每个进程保持了私有地址空间的抽象概念。

#include<sys/types.h>
#include<unistd.h>
#include<stdio.h>
 
int main()
{
    pid_t pid;
    int cnt = 0;
    pid = fork();
    if(pid<0)
        printf("error in fork!\n");
    else if(pid == 0)
    {
        cnt++;
        printf("cnt=%d\n",cnt);
        printf("I am the child process,ID is %d\n",getpid());
    }
    else
    {
        cnt++;
        printf("cnt=%d\n",cnt);
        printf("I am the parent process,ID is %d\n",getpid());
    }
    return 0;
}

cnt=1
I am the parent process,ID is 3138
cnt=1
I am the child process,ID is 3139

cnt 都是 1，说明 fork 时两进程间有私有地址空间的概念，当其中一个进程更改 cnt 时，即发生写时复制。

二、vfork()

vfork() 保证子进程先运行，在调用 exec 或 exit 之前与父进程数据是共享的。父进程在子进程调用 exec 或 exit 之后才可能被调度运行，如果在调用这两个函数之前子进程依赖于父进程的进一步动作，则会导致死锁。

vfork() 创建的子进程如果没有调用exec或exit会发送错误。

子进程调用 exit 结束

#include<sys/types.h>
#include<unistd.h>
#include<stdio.h>
 
int main()
{
    pid_t pid;
    int cnt = 0;
    pid = vfork();
    if(pid<0)
        printf("error in fork!\n");
    else if(pid == 0)  // 子进程
    {
        cnt++;
        printf("cnt=%d\n",cnt);
        printf("I am the child process,ID is %d\n",getpid());
        _exit(0);  // 调用 exit()
    }
    else
    {
        cnt++;
        printf("cnt=%d\n",cnt);
        printf("I am the parent process,ID is %d\n",getpid());
    }
    return 0;
}

cnt=1
I am the child process,ID is 3222
cnt=2
I am the parent process,ID is 3221

cnt 递增，说明 vfork 两进程共用地址空间，没有写时复制。

子进程调用 exec 加载和执行新程序

#include<sys/types.h>
#include<unistd.h>
#include<stdio.h>
 
int main()
{
    pid_t pid;
    int cnt = 0;
    pid = vfork();
    if(pid<0)
        printf("error in fork!\n");
    else if(pid == 0)
    {
        cnt++;
        printf("cnt=%d\n",cnt);
        printf("I am the child process,ID is %d\n",getpid());
        char *argv[ ]={NULL};
        char *envp[ ]={NULL};
        execve("/home/ooc/test/cpp/b.out",argv,envp);
        // b.out 输出 "execve() is running"
    }
    else
    {
        cnt++;
        printf("cnt=%d\n",cnt);
        printf("I am the parent process,ID is %d\n",getpid());
    }
    return 0;
}

cnt=1
I am the child process,ID is 3802
cnt=2
I am the parent process,ID is 3801
execve() is running

调用 execve 时，会加载 b.out 代替当前程序，这个过程会创建自己的地址空间，为新程序的代码、数据、bss 和栈区域创建新的区域结构，映射共享区域，设置程序计数器等等。

三、总结

vfork 用于创建一个新进程，而该新进程的目的是 exec 一个新进程。vfork 和 fork 一样都创建一个子进程，但是它并不将父进程的地址空间完全复制到子进程中，不会复制页表。因为子进程会立即调用 exec，于是也就不会存放该地址空间。不过在子进程中调用 exec 或 exit 之前，他在父进程的空间中运行。

为什么会有 vfork，因为以前的 fork 很傻，它创建一个子进程时，将会创建一个新的地址空间，并且拷贝父进程的资源，而往往在子进程中会执行 exec 调用，这样，前面的拷贝工作就是白费力气了，这种情况下，聪明的人就想出了 vfork，它产生的子进程刚开始暂时与父进程共享地址空间（其实就是线程的概念了），因为这时候子进程在父进程的地址空间中运行，所以子进程最好不要进行写操作，在子进程执行 exec 或者 exit 之前，父进程也处于阻塞状态。

vfork 和 fork 之间的另一个区别是： vfork 保证子进程先运行，在它调用 exec 或 exit 之后父进程才可能被调度运行。如果在调用这两个函数之前子进程依赖于父进程的进一步动作，则会导致死锁。由此可见，这个系统调用是用来启动一个新的应用程序。其次，子进程在 vfork() 返回后直接运行在父进程的栈空间，并使用父进程的内存和数据。这意味着子进程可能破坏父进程的数据结构或栈，造成失败。所以子进程还最好避免改变全局数据结构或全局变量中的任何信息，因为这些改变都有可能使父进程不能继续。通常，如果应用程序不是在 fork() 之后立即调用 exec()，就有必要在 fork() 被替换成 vfork() 之前做仔细的检查。

用 vfork 函数创建子进程后，子进程往往要调用一种 exec 函数以执行另一个程序，当进程调用一种 exec 函数时，该进程完全由新程序代换，而新程序则从其 main 函数开始执行，因为调用 exec 并不创建新进程，所以前后的进程 id 并未改变，exec 只是用另一个新程序替换了当前进程的正文，数据，堆和栈段。