Linux下创建新进程的系统调用是fork(),定义如下:
#include <unistd.h>
pid_t fork(void);
函数每次调用都返回两次,父进程返回的是子进程的PID,子进程返回0。该返回值是后续代码判断当前进程是父进程还是子进程的依据。fork失败时返回-1,并设置errno。
fork函数复制当前进程,在内核进程表中创建一个新的进程表项。新的进程表项有很多属性和原进程相同,比如堆指针、栈指针和标志寄存器的值。也有许多属性被赋予了新的值,比如该进程的PPID(父进程ID)被设置成原进程的PID(进程ID),信号位图被清除(原进程设置的信号处理函数不再对新进程起作用)。
子进程的代码和父进程完全相同,同时它也会复制父进程的数据(堆数据、栈数据和静态数据)。数据的复制采用的是写时拷贝,即只有在任一进程(父进程或子进程)对数据进行了写操作时,复制才会发生(先是缺页中断,然后操作系统给子进程分配内存并复制父进程的数据)。即便如此,如果我们在程序中分配了大量内存,那么使用fork时候也要十分谨慎,尽量避免不必要的内存分配和数据复制。
此外,创建子进程后,父进程中打开的文件描述符默认在子进程中也是打开的,且文件描述符的引用计数加1。不仅如此,父进程的用户根目录、当前工作目录的等变量的引用计数均会加1。
选自Linux高性能服务器编程