1、fork简介*重点内容*
一个进程,包括代码、数据和分段配给进程的资源。fork()函数通过系统调用创建一个与原来进程几乎完全相同的进程,也就是两个进程可以做完全相同的事,但如果初始参数或者传入的变量的不同,两个进程也可以做不同的事。
一个进程调用fork()函数后,系统先给新的进程分配资源,例如存储数据和代码的空间。然后把原来的进程的所有值都复制到新进程中,只有少数值与原来的进程的值不同。相当于克隆了一个自己。
fork()调用的一个奇妙之处就是它仅仅被调用一次,却能够返回两次,他可能有三种不同的返回值:
**1)在父进程中,fork返回新创建子进程的进程ID;
2)在子进程中,fork返回0;
3)如果出现错诶,fork返回-1**
在fork函数执行完毕之后,如果创建新进程成功,则出现两个进程,一个是子进程,一个是父进程。!!!在子进程中,fork函数返回0,在父进程中,fork返回新创建子进程的进程ID。我们可以通过fork返回的值来判断当前进程是子进程还是父进程。
fork出错可能有两种原因:
1)当前的进程数已经达到了系统规定的上限,这时errno的值被设置为EAGAIN.
2)系统内存不足,这时errno的值被设置为ENOMEM。
创建新进程成功后,系统中出现两个基本完全相同的进程,这两个进程执行没有先后顺序,那个进程先执行要看系统的进程调度策略。
2. 例题
#include<stdio.h>
#include<sys/types.h>
#include<unistd.h>
int main()
{
int i;
for(i = 0;i < 2;i++)
{
fork();
printf("a\n");
}
return 0;
}
注意这个题目中输出的时候有\n,刷新了缓冲区,所以只能是6个!!!!!
i = 0 a a 2个
i = 1 a a a a 4个
再看下面这道
#include<stdio.h>
#include<sys/types.h>
#include<unistd.h>
int main()
{
int i;
for(i = 0;i < 2;i++)
{
fork();
printf("a");
}
return 0;
}
实际上这个程序输出8个a。
要讲清楚这个题,我们要首先需要知道fork()系统调用的特性,
**fork() 系统调用是Unix下自身进程创建子进程的系统调用,一次调用,两次返回,如果返回是0,则是子进程,如果返回值>0,则是父进程(返回值是子进程的pid)。
还有一个很重要的东西,在fork()的调用处,整个父进程空间会原模原样的复制到子进程中,包括指令,变量值,程序调用栈,环境变量,缓冲区,等等。**
所以,上面的那个程序为什么会输出8个“a”,这是因为printf(“a”);语句有buffer,所以,对于上述程序,printf(“a”);把“a”放到了缓存中,并没有真正的输出(参看《C语言的迷题》中的第一题),在fork的时候,缓存被复制到了子进程空间,所以,就多了2个,就成了8个,而不是6个。!!!!!!!!!!!!!
另外,多说一下,我们知道,Unix下的设备有“块设备”和“字符设备”的概念,所谓块设备,就是以一块一块的数据存取的设备,字符设备是一次存取一个字符的设备。磁盘、内存都是块设备,字符设备如键盘和串口。块设备一般都有缓存,而字符设备一般都没有缓存。
对于上面的问题,我们如果修改一下上面的printf的那条语句为:
printf("a");
fflush(stdout);
就没有问题了(就是6个“a”了),因为程序遇到“\n”,或是EOF,或是缓中区满,或是文件描述符关闭,或是主动flush,或是程序退出,就会把数据刷出缓冲区。!!!!需要注意的是,标准输出是行缓冲,所以遇到“\n”的时候会刷出缓冲区,但对于磁盘这个块设备来说,“\n”并不会引起缓冲区刷出的动作,那是全缓冲,你可以使用setvbuf来设置缓冲区大小,或是用fflush刷缓存。
用图来解释更直观:
注意:上图中的我用了几个色彩,相同颜色的是同一个进程。
这样,对于printf(“a”);这个语句,我们就可以很清楚的知道,哪个子进程复制了父进程标准输出缓中区里的的内容,而导致了多次输出了。(如下图所示,就是我阴影并双边框了那两个子进程)
例题2:下面代码的输出结果是()
int main(){
int pid;
int num=1;
pid=fork();
if(pid>0){
num++;
printf("in parent:num:%d addr:%x\n",num,&num);
}
else if(pid==0){
printf("in child:num:%d addr:%x\n",num,&num);
}
}
答案:**父子进程中输出的num不同,num地址相同。
虚拟地址空间,num地址的值相同,但是其真实的物理地址却不一样。**
问题就出在地址想不相同,如果按照两个进程各处在独自的虚拟进程地址空间分析的话,这个题很容易会选择num地址不相同,但是Linux中的资源分配都是虚拟机制,也就是说,他们还是会共用一个虚拟的地址,但是映射到物理内存就可能会不一样。