函数原型:
#include <unsidt.h>
pid_t fork(void);
返回值:子进程返回0,父进程返回子进程的进程ID,出错返回-1.
1)功能与返回值
父进程通过调用fork函数用来创建子进程,父进程被调用一次,但返回两次,返回两次的唯一区别是子进程的返回值是0,父进程的返回值是创建的子进程的进程ID。
2)返回值成因
至于为什么父进程返回子进程ID,子进程返回0,内核是这样安排的:理想情况下,不管是
父进程还是子进程我们都可以直接得到它们的进程ID,但是现实是我们不能直接进行获取,
而是通过父进程获取其子进程的ID,通过子进程调用getpid获得其父进程的进程ID。这样做
的安排是一个进程的子进程可以很多,没有实现一个函数可以获取所有子进程的所有的进程
ID。所以只有在创建子进程的时候通过返回子进程ID的方式来使父进程获取子进程的ID。至
于子进程返回0,是因为子进程的ID是由父进程负责来获取,而自己的返回值必须是一个不
与自己的进程号相冲突的值,因此选取了0作为其返回值,因为进程ID 0总是由内核交换进程
使用的,所以一个子进程的进程ID不可能为0。
3)父子进程的空间关系
在父进程通过调用fork创建子进程后,子进程就是父进程的副本。具体是这样的:
子进程获得了父进程的数据空间、堆和栈的拷贝。不仅如此,子进程与父进程共享代码段
也就是说父子进程拥有相同的代码,并且父子进程从代码的fork函数之后开始执行。在此注意
的是父、子进程并不共享存储空间(数据段、堆和栈),而是对此空间子进程有自己的单独拷贝。
它们只会共享代码段。
4)fork函数的意义
操作系统产生进程的机制是这样的,首先在新的地址空间里创建进程,然后读入可执行文件,最
后开始执行。fork函数的意义在于通过拷贝当前进程创建一个进程,这样子进程在新的地址空间
就拥有了可以执行的环境。而exec函数负责读取可执行文件并将其载入地址空间开始运行。
5)写时复用技术
传统的fork函数直接把所有的资源复制给新创建的进程。这种实现过于简单并且效率低下,因为
它拷贝的数据也许并不共享,更糟糕的是,新进程如果打算立即执行一个新的映像,那么所有的
拷贝都将前功尽弃。因此现在的很多实现并不执行一个父进程数据段、堆和栈的完全拷贝。而是
采用写时复用技术。这些区域由父、子进程共享,而且内核将他们的访问权限改变为只读。如果
父、子进程中的任何一个试图修改这些区域,则内核只为修改区域的那块内存制作一个副本,通
常是虚拟存储器系统中的一“页”。
6)父子进程的执行
在fork之后是父进程先执行还是子进程先执行是不确定的,这取决于内核的调度算法。如果要求
父、子进程之间相互同步,则要求某种形式的相互通信。
7)fork函数示例
#include "apue.h"
int glob = 6;
char buf[] = "a write to stdout\n";
int main(void)
{
int var;
pid_t pid;
var = 88;
if(write(STDOUT_FILENO, buf, sizeof(buf)-1) != sizeof(buf)-1)
err_sys("write error");
printf("before fork\n");
if((pid = fork()) < 0)
{
err_sys("write error");
}
else if(pid == 0) /* child*/
{
glob++;
var++;
}
else /* parent*/
{
sleep(2);
}
printf("pid = %d, glob = %d, var = %d\n", getpid(), glob, var);
exit(0);
}
8)父子进程文件共享
fork的一个特性是父进程的所有打开文件描述符都被复制到子进程中。父、子进程的每个相同
的打开文件描述符共享一个文件表项(包括文件状态标志、当前文件偏移量、v结点指针等)。
在fork之后处理文件描述符有两种常见情况:
(1) 父进程等待子进程完成。这种情况下,父进程无需对其描述符做任何处理。当子进程终止
后,它曾进行读、写操作的任意共享描述符的文件偏移量已经执行了相应的更新。
(2) 父、子进程各自执行不同的程序段。在这种情况下,在fork后,父、子进程各自关闭它们
不需使用的文件描述符,这样就不会干扰对方使用的文件描述符。这种方法是网络服务进程中
经常使用的。
9)子进程继承的父进程的属性
除了打开文件以外,父进程的很多其他属性也有子进程继承。比如实际用户ID、进程组ID、根目录等。
10)父子进程的其它区别
父进程创进程后,子进程的tms_utime、tms_stime、tms_cutime以及tms_ustim均设置为0。
父进程设置的文件锁不会被子进程继承。
子进程的未处理的闹钟(alarm)被清除。
子进程的未处理信号集设置为空。
11)fork失败原因
系统中已有太多的进程,或者该实际用户ID的进程总数超过了系统限制。
12)fork的两种用法
(1) 一个父进程希望复制自己,使父、子进程同时执行不同的代码段。比如在网络服务器中父
进程等待客户端的服务请求。当请求到达时,父进程调用fork,使子进程处理此请求。父进程
则继续等待下一个服务请求到来。
(2) 一个进程要执行不同的程序。在这种情况下,子进程从fork返回后立即调用exec。
参考《UNIX环境高级编程》《linux内核设计与实现》