1,fork函数
#include <unistd.h>
pid_t fork(void);
返回值:子进程返回0,父进程中返回子进程id,出错返回-1
由fork创建的新进程被称为子进程。fork函数被调用一次,但返回两次。两次返回的唯一区别是子进程的返回值是0,而父进程的返回值则是新子进程的进程id。
为什么fork调用一次,却返回两次?其实不然,是从fork 行处,子进程共享了从fork处开始的代码指令,相当于子进程也运行了一遍后面的代码,不过子进程返回的是0,父进程返回的是子进程的id,是不是很神奇。例如:
........
pid_t pid;
pid = fork();
if(0 == pid)
{
//child process;
}
else if(pid > 0)
{
//parent process
}
......//
2,父子进程,数据段和代码段
子进程和父进程继续执行fork调用之后的指令。子进程是父进程的副本。例如,子进程获得父进程的数据空间、堆和栈的副本。注意,这是子进程所拥有的副本。父子进程并不共享这些存储空间部分。父子进程共享正文段。
3,写时复制
由于在fork之后经常跟随着exec,所以现在很多的实现并不执行一个父进程数据段、堆和栈的完全复制。作为替代,使用了写时复制(copy-on-write,cow)技术,这些区域由父子进程共享,而且内核将它们的访问权限改变为只读。如果父子进程中的任一个试图修改这些区域,则内核只为修改区域的那块内存制作一个副本,通常是虚拟存储器系统中的一“页”。
4,举个例子
#include <unistd.h>
#include <stdio.h>
int glob = 8;
char buf[] = "hello world\n";
int main ()
{
pid_t fpid; //fpid表示fork函数返回的值
int count=0;
if(write(STDOUT_FILENO, buf, sizeof(buf)-1) != sizeof(buf)-1)
printf("write error\n");
printf("before fork\n");
fpid=fork();
if (fpid < 0)
printf("error in fork!");
else if (fpid == 0) {
printf("i am child\n");
glob++;
count++;
}
else {
sleep(1);
printf("i am parent\n");
}
printf("pid=%d, glob=%d, count=%d\n", getpid(),glob,count);
printf("pid=%d, &glob=%p,&count=%p\n", getpid(),&glob,&count);
return 0;
}
运行两次,一次直接输出到终端,一次是写到文件中。
可以看到父子进程中,全局变量glob和局部变量count最后的值不一样,这样刚好验证了,子进程只是父进程的副本,并不共享数据段,都各自保存了一份,互不影响。这里还有个奇怪的打印,写到文件后,printf(“before fork\n”)打印了两次,分别在父进程和子进程各自打印一次?
与缓冲区有关。write函数是不带缓冲的,在fork之前调用write ,所以其数据写到标准输出一次。但是,标准i/o 库是带缓冲的,如果标准输出连到终端设备,则它是行缓冲的,否则它是全缓冲的。当以交互方式运行该程序时,只得到该printf 输出的行一次,其原因是标准输出缓冲区由换行符冲洗。但是当标准输出重定向到一个文件时,却得到printf输出两次。这是因为,在fork之前调用了printf 一次,但当调用fork 时,该行数据仍在缓冲区中,然后在讲父进程数据空间复制到子进程时,该缓冲区也被复制到子进程中。于是那时父、子进程各自有了带该行内容的标准i/o 缓冲区。在exit 之前的第二个printf 将其数据添加到现有的缓冲区中。当每个进程终止时,最终会冲洗其缓冲区的副本。
5,文件共享
fork 的另外一个特性需要注意:父进程的所有打开的文件描述符都被复制到子进程中。父子进程的每个相同的打开描述符共享一个文件表项。换句话来说,在子进程中操作某个文件描述符会影响父进程相应的描述符,因为这种共享方式使父、子进程对同一文件使用了一个文件偏移量。
所以在fork之后处理文件描述符有两种常见的情况:
- 父进程等待子进程完成。在这种情况下,父进程无需对描述符做任何处理。当子进程终止后,它曾进行过读、写操作的任一共享描述符的文件偏移量已执行了相应更新。
- 父子进程各自执行不同的程序段。在这种情况下,在fork之后,父子进程各自关闭它们不需使用的文件描述符,这样就不会干扰对方使用的文件描述符,该方法在网络服务进程中经常使用。
6,fork后,父子进程区别:
- fork的返回值
- 进程id不同
- 两个进程具有不同的父进程id
- 子进程的tms_utime、tms_stime、tms_cutime、tms_ustime均被设置为0。