一、概述
fork 和 vfork 都是用来创建一个子进程的。
区别:
- fork() 子进程拷贝父进程的数据段和代码段,这里通过拷贝页表实现。vfork() 子进程与父进程共享地址空间,无需拷贝页表,效率更高。
- fork() 父子进程的执行次序不确定。vfork() 保证子进程先运行,在调用 exec 或 exit 之前与父进程数据是共享的。父进程在子进程调用 exec 或 exit 之后才可能被调度运行,如果在调用这两个函数之前子进程依赖于父进程的进一步动作,则会导致死锁。
一、fork()
当 fork 函数被当前函数调用时,内核为新进程创建各种数据结构,并分配给它一个唯一的 PID。为了给这个新进程创建虚拟内存,它创建了当前进程的 mm_struct,区域结构和页表的原样副本,并将两个进程中的每个区域结构都标记为私有的写时复制。
当 fork 在新进程中返回时,新进程现在的虚拟内存刚好和调用fork时存在的虚拟内存相同。当这两个进程中的任一个后来进行写操作时,写时复制机制就会创建新页面。因此,也就为每个进程保持了私有地址空间的抽象概念。
#include<sys/types.h>
#include<unistd.h>
#include<stdio.h>
int main()
{
pid_t pid;
int cnt = 0;
pid = fork();
if(pid<0)
printf("error in fork!\n");
else if(pid == 0)
{
cnt++;
printf("cnt=%d\n",cnt);
printf("I am the child process,ID is %d\n",getpid());
}
else
{
cnt++;
printf("cnt=%d\n",cnt);
printf("I am the parent process,ID is %d\n",getpid());
}
return 0;
}
cnt=1
I am the parent process,ID is 3138
cnt=1
I am the child process,ID is 3139
cnt 都是 1,说明 fork 时两进程间有私有地址空间的概念,当其中一个进程更改 cnt 时,即发生写时复制。
二、vfork()
vfork() 保证子进程先运行,在调用 exec 或 exit 之前与父进程数据是共享的。父进程在子进程调用 exec 或 exit 之后才可能被调度运行,如果在调用这两个函数之前子进程依赖于父进程的进一步动作,则会导致死锁。
vfork() 创建的子进程如果没有调用exec或exit会发送错误。
子进程调用 exit 结束
#include<sys/types.h>
#include<unistd.h>
#include<stdio.h>
int main()
{
pid_t pid;
int cnt = 0;
pid = vfork();
if(pid<0)
printf("error in fork!\n");
else if(pid == 0) // 子进程
{
cnt++;
printf("cnt=%d\n",cnt);
printf("I am the child process,ID is %d\n",getpid());
_exit(0); // 调用 exit()
}
else
{
cnt++;
printf("cnt=%d\n",cnt);
printf("I am the parent process,ID is %d\n",getpid());
}
return 0;
}
cnt=1
I am the child process,ID is 3222
cnt=2
I am the parent process,ID is 3221
cnt 递增,说明 vfork 两进程共用地址空间,没有写时复制。
#include<sys/types.h>
#include<unistd.h>
#include<stdio.h>
int main()
{
pid_t pid;
int cnt = 0;
pid = vfork();
if(pid<0)
printf("error in fork!\n");
else if(pid == 0)
{
cnt++;
printf("cnt=%d\n",cnt);
printf("I am the child process,ID is %d\n",getpid());
char *argv[ ]={NULL};
char *envp[ ]={NULL};
execve("/home/ooc/test/cpp/b.out",argv,envp);
// b.out 输出 "execve() is running"
}
else
{
cnt++;
printf("cnt=%d\n",cnt);
printf("I am the parent process,ID is %d\n",getpid());
}
return 0;
}
cnt=1
I am the child process,ID is 3802
cnt=2
I am the parent process,ID is 3801
execve() is running
调用 execve 时,会加载 b.out 代替当前程序,这个过程会创建自己的地址空间,为新程序的代码、数据、bss 和栈区域创建新的区域结构,映射共享区域,设置程序计数器等等。
三、总结
vfork 用于创建一个新进程,而该新进程的目的是 exec 一个新进程。vfork 和 fork 一样都创建一个子进程,但是它并不将父进程的地址空间完全复制到子进程中,不会复制页表。因为子进程会立即调用 exec,于是也就不会存放该地址空间。不过在子进程中调用 exec 或 exit 之前,他在父进程的空间中运行。
为什么会有 vfork,因为以前的 fork 很傻, 它创建一个子进程时,将会创建一个新的地址空间,并且拷贝父进程的资源,而往往在子进程中会执行 exec 调用,这样,前面的拷贝工作就是白费力气了,这种情况下,聪明的人就想出了 vfork,它产生的子进程刚开始暂时与父进程共享地址空间(其实就是线程的概念了),因为这时候子进程在父进程的地址空间中运行,所以子进程最好不要进行写操作,在子进程执行 exec 或者 exit 之前,父进程也处于阻塞状态。
vfork 和 fork 之间的另一个区别是: vfork 保证子进程先运行,在它调用 exec 或 exit 之后父进程才可能被调度运行。如果在调用这两个函数之前子进程依赖于父进程的进一步动作,则会导致死锁。由此可见,这个系统调用是用来启动一个新的应用程序。其次,子进程在 vfork() 返回后直接运行在父进程的栈空间,并使用父进程的内存和数据。这意味着子进程可能破坏父进程的数据结构或栈,造成失败。所以子进程还最好避免改变全局数据结构或全局变量中的任何信息,因为这些改变都有可能使父进程不能继续。通常,如果应用程序不是在 fork() 之后立即调用 exec(),就有必要在 fork() 被替换成 vfork() 之前做仔细的检查。
用 vfork 函数创建子进程后,子进程往往要调用一种 exec 函数以执行另一个程序,当进程调用一种 exec 函数时,该进程完全由新程序代换,而新程序则从其 main 函数开始执行,因为调用 exec 并不创建新进程,所以前后的进程 id 并未改变,exec 只是用另一个新程序替换了当前进程的正文,数据,堆和栈段。
(SAW:Game Over!)