最近调试一个项目,发现在vfork创建的子进程下断点失败,于是研究了一下vfork和fork,然后得此文。
pid_t pid = vfork();
if (pid < 0) {
return false;
}
else if (pid == 0) {
//断点失败
}
(gdb) set follow-fork-mode child
然后再说下vfork和fork。
首先两个都是Linux的系统调用,在Linux内核中的源码为:
SYSCALL_DEFINE0(fork)
{
return do_fork(SIGCHLD, 0, 0, NULL, NULL);
}
SYSCALL_DEFINE0(vfork)
{
return do_fork(CLONE_VFORK | CLONE_VM | SIGCHLD, 0,
0, NULL, NULL);
}
可以看出他们都是通过do_fork函数实现,不一样的在于函数的输入参数clone_flags。
在《Linux内核设计与实现》中写到,vfork不拷贝父进程的页表项,可以从do_fork-->copy_process-->copy_mm函数中对clone_flags的判断看出vfork和fork对于父进程页表项的处理。
if (clone_flags & CLONE_VM) {
atomic_inc(&oldmm->mm_users);
mm = oldmm;
goto good_mm;
}
retval = -ENOMEM;
mm = dup_mm(tsk);
if (!mm)
goto fail_nomem;
然后在do_fork函数的末尾处会判断CLONE_VFORK参数。
if (clone_flags & CLONE_VFORK) {
p->vfork_done = &vfork;
init_completion(&vfork);
get_task_struct(p);
}
wake_up_new_task(p);
/* forking complete and child started to run, tell ptracer */
if (unlikely(trace))
ptrace_event_pid(trace, pid);
if (clone_flags & CLONE_VFORK) {
if (!wait_for_vfork_done(p, &vfork))
ptrace_event_pid(PTRACE_EVENT_VFORK_DONE, pid);
}
可以看出使用vfork时,系统调用会等待子进程开始执行后返回,其实这样操作的原因也是因为子进程没有自己的页表项,如果不做等待的操作,会导致主进程和子进程使用同样页表,两个进程用样的页表,想想后果吧。
所以可以看出vfork和fork本质上的区别是:fork的子进程会拷贝主进程的页表项,而vfork的子进程共享主进程的页表项。
因为这样的区别,所以使用vfork时主进程会等待子进程执行exec或exit操作后才会开始执行;如果vfork的子进程中不包含exec或者exit操作,而是直接退出,则会有导致主进程的操作异常,因为主进程的页表项在子进程退出的时候已经销毁,相当于主进程自己没了页表项。
那么vfork的好处是什么呢?避免一次主进程页表项的拷贝,因为子进程一般都会调用exec执行自己的程序代码,而在exec过程中会创建自己的页表项,根本不需要复制主进程的页表项。
那么vfork在现代Linux中是否真能体现它的优点呢?其实不尽然。
在拷贝页表项时,调用了函数dup_mm,其中会使用到COW(写时复制)技术(dup_mm-->copy_page_range),所谓的内存拷贝其实只是对内存的一个标记,只有在需要对该区域进行标记而已,并不会真正的拷贝。
is_cow = is_cow_mapping(vma->vm_flags);
mmun_start = addr;
mmun_end = end;
if (is_cow)
mmu_notifier_invalidate_range_start(src_mm, mmun_start,
mmun_end);
所以其实vfork与fork除了在使用上需要注意子进程和主进程的执行先后顺序之外,在性能上的差别已经很小了。