功能:一个现有进程可以调用fork函数创建一个新进程。
由fork创建的新进程被称为子进程(child process) 。fork函数被调用一次,但返回两次。两次返回的区别是子进程的返回值是,而父进程的返回值则是新建子进程的进程pid。将子进程返回给父进程的理由是:因为一个进程的子进程可以有多个,并且没有一个函数使一个进程可以获得其所由子进程的pid。fork使子进程得到返回值0的理由是:一个进程只会有一个父进程,所以子进程总是了可以调用getppid以获得父进程的pid(进程ID0总是由内核交换使用,所以一个子进程的进程ID不可能为0)。
子进程和父进程继续执行fork之后的指令。子进程是父进程的副本,例如子进程获得父进程数据空间,堆和栈的副本。注意,这是子进程所拥有的副本。父进程和子进程并不共享这些存储空间部分。父进程和子进程共享正文端,如图:
由于在fork之后经常跟随着exec,所以现在很多实现并不执行一个父进程数据段,堆和栈的完全副本。作为替代,使用了写时拷贝(Copy-On-Write,COW)技术。这些区域由父进程和子进程中的任一个试图修改这些区域,则内核只为修改区域的那块内存制作一个副本,通常是虚拟存储中的一"页"。
#include <sys/types.h>
#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>
int globvar = 6;
char buff[] = "a write to stdout\n";
int
main(void)
{
int var;
pid_t pid;
var = 88;
if(write(STDOUT_FILENO,buff,sizeof(buff) - 1) != sizeof(buff) - 1)
{
perror("write error");
}
printf("before fork\n");
if(pid = fork() < 0)
{
perror("fork error");
}
else if(pid == 0) //child
{
globvar++;
var++;
}
else //parent
{
sleep(2);
}
printf("pid = %d,glob = %d,var = %d\n",(long)getpid(),globvar,var);
exit(0);
}
执行结果得到:
一般来说,在fork之后是父进程先执行还是子进程先执行是不确定的,这取决于内核所使用的调度算法。如果要求父进程和子进程相互同步,则要求某种形式的进程间通信。在上图中,父进程是自己休眠2秒钟,以此使子进程先执行。
当标准输出时,我们将buff的长度减1作为输出字节数,这是为了避免将终止'\0'字节写出。strlen计算不包括终止'\0'的字节的字符串长度,而sizeof则计算终止'\0'字节的缓冲区长度。两者之间的差异是,使用strlen需进行一次函数调用,而对于sizeof而言,因为缓冲区已用已知字符串进行初始化,其长度是固定的,所以sizeof是在编译时计算缓冲区长度。
write函数是不带缓冲区的,在fork之前调用了write,所以其数据写到标准输出一次。但是,标准IO库是带缓冲区的,如果标准输出连接到终端设备,则它是行缓冲;否则同时全缓冲。当以交互的方式运行该程序时,只得到该printf输出的行一次,其原因是标准输出缓冲区由换行符冲洗。但是当标准输出重定向到一个文件时,却得到printf输出行两次。其原因是,在fork之前调用printf一次,但当调用fork时,该行仍在缓冲区中,然后父进程数据空间复制到子进程时,该缓冲区也被复制到子进程中,此时父进程和子进程各自有了带该行内容的缓冲区。在exit之前的第二个printf将其数据追加到已有缓冲区中,当每个进程终止时,其缓冲区内容都被写到相应的文件。