fork函数
#iclude <unistd.h>
pid_t fork(void);
一个现有进程可以调用fork创建一个新进程。
返回值:子进程中返回0,父进程中返回子进程ID,出错返回-1
子进程是父进程的副本。例如:子进程获得父进程数据空间、堆和栈的副本(主要是数据结构的副本)。父子进程不共享这些存储空间部分。父子进程共享正文段。
由于fork之后经常归属exec,所以现在很多实现并不执行一个父进程数据段、栈和堆的完全复制。作为替代,使用了写时复制(Copy-On-Write)技术。这些区域由父子进程共
享,而且内核将他们的访问权限改变为只读的。如果父子进程中的任一个试图修改这些区域,则内核只为修改区域的那块内存制作一个副本。
一般来说,在fork之后的父进程先执行还是子进程先执行是不确定的。(取决于内核的调度算法)
子进程可以通过getppid函数获得自己父进程的ID,进程可以通过getpid函数获得自己的ID。
在linux中存在缓冲区的问题。当写printf函数,但是没有换行的话,它是不会输出的,而是先将要输出的内容存放再缓冲区中,当碰到换行时,将缓冲区中的内容再一起输出。
所以fork后子进程会复制父进程的缓冲区,因此也将待输出内容复制到自己“与父进程独立的缓冲区中”,因此当子进程执行遇到换行,就将缓冲区中的内容全都输出来。
下面看这个函数:
#include <stdio.h>
#include <unistd.h>
int main(void)
{
int i;
for(i=0; i<2; i++){
fork();
printf("-");
}
return 0;
}
由于printf中没有换行,它会将数据先放在缓冲区中,当碰到换行时一起输出
现在分析一下这个·函数
当i=0时,主进程先fork一个子进程1,此时有两个进程执行fork后面的代码。
主进程和子进程1各自打印一个‘-’,但是由于不会刷新缓冲区,所以不会输出,‘-’都保存在缓冲区中。
for循环继续,此时i=1;其主进程再次fork一个子进程2,子进程1也fork一个子进程3, 子进程2和子进程3各自copy一分其父进程的数据空间、堆和栈的副本(主要是数据结构的副本),也会copy其父进程的缓冲区。,子进程2和子进程3执行printf之前在各自的缓冲区中各有一个‘-’,然后执行printf,各自缓冲区中变两个‘–’。而主进程和子进程1的缓冲区中各有一个‘-’,然后其各自再执行printf,其缓冲区的内容变为‘–’。所以其最后打印8个‘-’。缓冲区这块你可在printf后加个sleep(1)看看。
如果其printf(“-\n “),加了\n,则会打印6个,因为\n会刷新缓冲区,每次执行完printf都会刷新缓冲区,在fork进程时copy过去的缓冲区也是空的,所以会是6个,而且每次执行完printf后都会输出一个结果。