(一)vfork和fork的区别
fork 是创建一个子进程,并把父进程的内存数据copy到子进程中。
vfork 是创建一个子进程,并和父进程的内存数据share一起用。
为什么有vfork,因为大多数fork的子进程就直接exec
或者exit
那么再copy一份内存数据就显得没必要了。
在子进程调用exec和exit之前,都在父进程的空间中运行。
所以,BSD搞出了个父子进程共享的 vfork,这样成本比较低。因此,vfork本就是为了exec而生。
另外vfork跟fork还有一个区别就是:vfork保证子进程先运行,在它调用exec或者exit之后父进程才被调度,当子进程调用这两个函数中的任意一个时,父进程会恢复运行。
(二)vfork与core dump
详情见vfork挂掉的一个问题
代码见:https://github.com/NearXdu/APUE
在子进程中使用return就会挂掉:
//bad_vfork.c
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
int glob = 6;
int
main(void)
{
int var;
pid_t pid;
var = 88;
printf("before vfork\n");
if ((pid = vfork()) < 0) {
printf("vfork error");
exit(-1);
} else if (pid == 0)
{
/* 子进程 */
glob++;
var++;
return 0;
}
printf("pid=%d, glob=%d, var=%d\n", getpid(), glob, var);
return 0;
}
从上面我们知道,结束子进程的调用是exit()而不是return,如果你在vfork中return了,那么,这就意味main()函数return了,
注意因为函数栈父子进程共享,所以整个程序的栈就跪了。
如果你在子进程中return,那么基本是下面的过程:
1)子进程的main() 函数 return了,于是程序的函数栈发生了变化。
2)而main()函数return后,通常会调用 exit()或相似的函数(如:_exit(),exitgroup())
3)这时,父进程收到子进程exit(),开始从vfork返回,但是尼玛,老子的栈都被你子进程给return干废掉了,你让我怎么执行?(注:栈会返回一个诡异一个栈地址,对于某些内核版本的实现,直接报“栈错误”就给跪了,然而,对于某些内核版本的实现,于是有可能会再次调用main(),于是进入了一个无限循环的结果,直到vfork 调用返回 error
好了,现在再回到 return 和 exit,return会释放局部变量,并弹栈,回到上级函数执行。
exit直接退掉。如果你用c++ 你就知道,return会调用局部对象的析构函数,exit不会。(注:exit不是系统调用,是glibc对系统调用_exit()
或_exitgroup()
的封装)
可见,子进程调用exit() 没有修改函数栈,所以,父进程得以顺利执行。
但是!注意!如果你调用 exit() 函数,还是会有问题的,正确的方法应该是调用 _exit()
函数,因为 exit()
函数 会 flush 并 close 所有的 标准 I/O
这样会导致父进程受到影响。
正确的代码:
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
int glob = 6;
int
main(void)
{
int var;
pid_t pid;
var = 88;
printf("before vfork\n");
if ((pid = vfork()) < 0) {
printf("vfork error");
exit(-1);
} else if (pid == 0) {
/* 子进程 */
glob++;
var++;
_exit(0);
}
printf("pid=%d, glob=%d, var=%d\n", getpid(), glob, var);
return 0;
}
也不需要在父进程中sleep,因为vfork保证了直到执行exec或者exit,父进程都处于休眠状态。
(三)fork的优化
很明显,fork太重,而vfork又太危险,所以,就有人开始优化fork这个系统调用。优化的技术用到了著名的写时拷贝(COW)。
也就是说,对于fork后并不是马上拷贝内存,而是只有你在需要改变的时候,才会从父进程中拷贝到子进程中,这样fork后立马执行exec的成本就非常小了。