fork()与vfork()函数（精简）

最新推荐文章于 2024-04-18 12:50:52 发布

不如吃个药

最新推荐文章于 2024-04-18 12:50:52 发布

阅读量169

点赞数

分类专栏： Linux学习文章标签： linux 操作系统

本文链接：https://blog.csdn.net/weixin_44062361/article/details/108650789

版权

Linux学习专栏收录该内容

17 篇文章 2 订阅

订阅专栏

0 简介

这两个函数都是创建进程的函数：

首先了解一下什么是进程：进程是计算机上的程序关于某个数据及时上的一次运行活动。

进程的四要素：
（1）有一段程序供其执行（不一定是一个进程所专有的），就像一场戏必须有自己的剧本。
（2）有自己的专用系统堆栈空间（私有财产）
（3）有进程控制块（task_struct）（“有身份证，PID”）
（4）有独立的存储空间。

缺少第四条的称为线程，如果完全没有用户空间称为内核线程，共享用户空间的称为用户线程。

系统调用	描述
fork	fork创造的子进程是父进程的完整副本，复制了父亲进程的资源，包括内存的内容task_struct内容
vfork	vfork创建的子进程与父进程共享数据段,而且由vfork()创建的子进程将先于父进程运行
clone	Linux上创建线程一般使用的是pthread库实际上linux也给我们提供了创建线程的系统调用，就是clone

1 fork函数

#include <sys/types.h>
#include <unistd.h>

pid_t fork(void);
//正确返回： 父进程中返回子进程的进程号；子进程中返回 0；
//错误返回：-1；
//fork函数返回后，子进程和父进程都是从fork函数的下一条语句开始执行。

1.1 代码示例

#include <stdio.h>
#include <stdlib.h>
#include <sys/types.h>
#include <unistd.h>

int main(void)
{
    int count = 1;
    int child;
    
    child = fork( );
    if(child < 0){
        perror("fork error : ");
    }
    else if(child == 0) {
        printf("This is son, count : %d (%p). pid : %d\n", ++count, &count, getpid());
    }
    else{
        printf("This is parent, count : %d (%p), pid : %d\n", ++count, &count, getpid());
    }
    return 0; 
}

代码执行结果：

在这里插入图片描述

1.2 分析

从运行结果里面可以看出父子两个进程的pid不同，堆栈和数据资源都是完全的复制，

子进程与父进程count的地址（虚拟地址）是相同的（注意他们在内核中被映射的物理地址不同），当真正使用的时候，写时复制技术大展身手了。

1.3 写时复制技术（Copy On Write）

原理：

这种思想相当简单：父进程和子进程共享页帧而不是复制页帧。然而，只要页帧被共享，它们就不能被修改，即页帧被保护。无论父进程还是子进程何时试图写一个共享的页帧，就产生一个异常，这时内核就把这个页复制到一个新的页帧中并标记为可写。原来的页帧仍然是写保护的：当其他进程试图写入时，内核检查写进程是否是这个页帧的唯一属主，如果是，就把这个页帧标记为对这个进程是可写的。
其基础的观念是，如果有多个呼叫者(callers)同时要求相同资源，他们会共同取得相同的指标指向相同的资源，直到某个呼叫者(caller)尝试修改资源时，系统才会真正复制一个副本(private copy)给该呼叫者，以避免被修改的资源被直接察觉到，这过程对其他的呼叫只都是通透的(transparently)。此作法主要的优点是如果呼叫者并没有修改该资源，就不会有副本(private copy)被建立。

当进程A使用系统调用fork创建一个子进程B时,由于子进程B实际上是父进程A的一个拷贝,

因此会拥有与父进程相同的物理页面.为了节约内存和加快创建速度的目标,fork()函数会让子进程B以只读方式共享父进程A的物理页面.同时将父进程A对这些物理页面的访问权限也设成只读.

这样,当父进程A或子进程B任何一方对这些已共享的物理页面执行写操作时,都会产生页面出错异常(page_fault int14)中断,此时CPU会执行系统提供的异常处理函数do_wp_page()来解决这个异常.

do_wp_page()会对这块导致写入异常中断的物理页面进行取消共享操作,为写进程复制一新的物理页面,使父进程A和子进程B各自拥有一块内容相同的物理页面.最后,从异常处理函数中返回时,CPU就会重新执行刚才导致异常的写入操作指令,使进程继续执行下去.

什么时候会触发这个技术：

当然是在共享同一块内存的类发生内容改变时，才会发生Copy On Write(写时复制)。

加深理解：

假设进程A创建子进程B,之后进程A和进程B共享A的地址空间，同时该地址空间中的页面全部被标识为写保护。此时B若写address的页面，由于写保护的原因会引起写异常，在异常处理中，内核将address所在的那个写保护页面复制为新的页面，让B的address页表项指向该新的页面，新页面可写。而A的address页表项依然指向那个写保护的页面。然后当B在访问address时就会直接访问新的页面了，不会在访问到哪个写保护的页面。当A试图写address所在的页面时，由于写保护的原因此时也会引起异常，在异常处理中，内核如果发现该页面只有一个拥有进程，此种情况下也就是A,则直接对该页面取消写保护，此后当A再访问address时不会在有写保护错误了。如果此时A又创建子进程C,则该address所在的页面又被设置为写保护，拥有进程A和C,同时其他页面例如PAGEX依然维持写保护，只是拥有进程A、B和C。如果此时A访问PAGEX，则异常处理会创建一个新页面并将PAGEX中的内容复制到该页面，同时A相应的pte指向该新页面。如果此时C也访问PAGEX，也会复制新页面并且让C对应的pte指向新页面。如果B再访问PAGEX，则由于此时PAGEX只有一个拥有进程B，故不再复制新页面，而是直接取消该页面的写保护，由于B的pte本来就是直接指向该页面，所以无需要在做其它工作。

2 vfork函数

使用vfork()函数创建子进程，保证子进程先运行，而fork()函数子进程父进程都内核连子进程的虚拟地址空间结构也不创建了，直接共享了父进程的虚拟空间，这种做法也顺理成章地共享了父进程的物理空间。

2.1 代码示例

#include <stdio.h>
#include <stdlib.h>
#include <sys/types.h>
#include <unistd.h>
int main(void)
{
    int count = 1;
    int child;
    printf("Before create son, the father's count is:%d\n", count);
    if((child = vfork())< 0)
    {
        perror("fork error : ");
    }
    else if(child == 0){
    //这里++count
        printf("This is son, his count is: %d (%p). and his pid is: %d\n", ++count, &count, getpid());
        exit(0);
    }
    else{
    //这里++count
        printf("After son, This is father, his count is: %d (%p), his pid is: %d\n", ++count, &count, getpid());
        exit(0);
    }

    return EXIT_SUCCESS;
}

运行结果：
在这里插入图片描述

我们要注意一点，使用vfork()在子进程中返回时,应该要避免使用return，使用exit(0)或者_exit(0)都可以

2.2 分析

vfork也是创建一个子进程，但不是真正意义上的进程，因为它缺少构成进程四要素的第四个，即没有独立的内存空间，所以说它是一个线程，子进程共享父进程的空间。在vfork创建子进程之后，父进程阻塞，直到子进程执行了exec()或者exit()。vfork最初是因为fork没有实现COW机制，而很多情况下fork之后会紧接着exec，而exec的执行相当于之前fork复制的空间全部变成了无用功，所以设计了vfork。而现在fork使用了COW机制，唯一的代价仅仅是复制父进程页表的代价。

vfork保证子进程先运行，在它调用exec或exit之后父进程才可能被调度运行。如果在调用这两个函数之前子进程依赖于父进程的进一步动作，则会导致死锁。
fork要拷贝父进程的进程环境；而vfork则不需要完全拷贝父进程的进程环境，在子进程没有调用exec和exit之前，子进程与父进程共享进程环境，相当于线程的概念，此时父进程阻塞等待。

为什么会有vfork呢?

因为以前的fork当它创建一个子进程时，将会创建一个新的地址空间，并且拷贝父进程的资源，然后将会有两种行为：

执行从父进程那里拷贝过来的代码段
调用一个exec执行一个新的代码段

3 区别

有了fork()函数，为什么要引入vfork()?

因为以前的fork当它创建一个子进程时，将会创建一个新的地址空间，并且拷贝父进程的资源，而往往在子进程中会执行exec调用，这样，前面的拷贝工作就是白费力气了，这种情况下，聪明的人就想出了vfork，它产生的子进程刚开始暂时与父进程共享地址空间（其实就是线程的概念了），因为这时候子进程在父进程的地址空间中运行，所以子进程不能进行写操作，一旦子进程执行了exec或者exit后，这个时候父子分家。此时vfork保证子进程先运行，在她调用exec或exit之后父进程才可能被调度运行。

用vfork函数创建子进程后，子进程往往要调用一种exec函数以执行另一个程序，当进程调用一种exec函数时，该进程完全由新程序代换，而新程序则从其main函数开始执行，因为调用exec并不创建新进程，所以前后的进程id 并未改变，exec只是用另一个新程序替换了当前进程的正文，数据，堆和栈段。

vfork保证子进程先运行，在它调用exec或exit之后父进程才可能被调度运行。如果在调用这两个函数之前子进程依赖于父进程的进一步动作，则会导致死锁。
fork要拷贝父进程的进程环境；而vfork则不需要完全拷贝父进程的进程环境，在子进程没有调用exec和exit之前，子进程与父进程共享进程环境，相当于线程的概念，此时父进程阻塞等待。

fork函数调用的用途

一个进程希望复制自身，从而父子进程能同时执行不同段的代码。
进程想执行另外一个程序

vfork函数调用的用途

用vfork创建的进程主要目的是用exec函数执行另外的程序，与fork的第二个用途相同

4 网上的一些实践项目

情景一：程序运行过程中，启动子进程，子进程进行一些数据处理，父子进程间使用管道传输。带来的问题是，fork后，内存消耗激增，基本是原来的两倍，这对我们来说是不能容忍的。因为子进程并不需要父进程的堆栈之类的东西，他不需要复制，他只需要干自己的事情就行。因此vfork更合适。
情景二：

5 参考

https://blog.csdn.net/daima3/article/details/103127616

不如吃个药

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
fork()与vfork()函数（精简）

这里写目录标题0 简介1 fork函数1.1 代码示例1.2 分析1.3 写时复制技术（Copy On Write）2 vfork函数2.1 代码示例2.2 分析3 区别参考0 简介这两个函数都是创建进程的函数：首先了解一下什么是进程：进程是计算机上的程序关于某个数据及时上的一次运行活动。进程的四要素：（1）有一段程序供其执行（不一定是一个进程所专有的），就像一场戏必须有自己的剧本。（2）有自己的专用系统堆栈空间（私有财产）（3）有进程控制块（task_struct）（“有身份证，PID”）
复制链接

扫一扫

专栏目录