一个关于fork()的面试题

前两天有人问了个关于Unix的fork()系统调用的面试题,这个题正好是我大约十年前找工作时某公司问我的一个题,我觉得比较有趣,写篇文章与大家分享一下。这个题是这样的:

题目:请问下面的程序一共输出多少个“-”?

#include <stdio.h>
#include <sys/types.h>
#include <unistd.h>
 
intmain(void)
{
   inti;
   for(i=0; i<2; i++){
      fork();
      printf("-");
   }
 
   wait(NULL);
   wait(NULL);
 
   return0;
};
 
如果你对fork()的机制比较熟悉的话,这个题并不难,输出应该是6个“-”,但是,实际上这个程序会很tricky地输出
8个“-”。
 
要讲清这个题,我们首先需要知道fork()系统调用的特性,
 
fork()系统调用是Unix下以自身进程创建子进程的系统调用,一次调用,两次返回,如果返回是0,则是子进程,
如果返回值>0,则是父进程(返回值是子进程的pid),这是众为周知的。
还有一个很重要的东西是,在fork()的调用处,整个父进程空间会原模原样地复制到子进程中,包括指令,变量值,
程序调用栈,环境变量,缓冲区,等等。
所以,上面的那个程序为什么会输入8个“-”,这是因为printf("-");语句有buffer,所以,对于上述程序,
printf("-");把“-”放到了缓存中,并没有真正的输出(参看《<a title="C语言的谜题
"href="http://coolshell.cn/articles/945.html"target="_blank">C语言的迷题</a>》中的第一题),
<strong>在fork的时候,缓存被复制到了子进程空间</strong>,所以,就多了两个,就成了8个,而不是6个。
 
另外,多说一下,我们知道,Unix下的设备有
“<a href="http://en.wikipedia.org/wiki/Device_file#Block_devices"target="_blank">块设备</a>”
和“<a href="http://en.wikipedia.org/wiki/Device_file#Character_devices"target="_blank">字符设备</a>”
的概念,所谓块设备,就是以一块一块的数据存取的设备,字符设备是一次存取一个字符的设备。
磁盘、内存都是块设备,字符设备如键盘和串口。<strong>块设备一般都有缓存,而字符设备一般都没有缓存</strong>。
 
对于上面的问题,我们如果修改一下上面的printf的那条语句为:
 
printf("-\n");


或是

1
2
printf ( "-" );
fflush (stdout);

就没有问题了(就是6个“-”了),因为程序遇到“\n”,或是EOF,或是缓中区满,或是文件描述符关闭,或是主动flush,或是程序退出,就会把数据刷出缓冲区。需要注意的是,标准输出是行缓冲,所以遇到“\n”的时候会刷出缓冲区,但对于磁盘这个块设备来说,“\n”并不会引起缓冲区刷出的动作,那是全缓冲,你可以使用setvbuf来设置缓冲区大小,或是用fflush刷缓存。

我估计有些朋友可能对于fork()还不是很了解,那么我们把上面的程序改成下面这样:

#include 
#include 
#include 
int main(void)
{
int i;
for(i=0; i<2; i++){ fork(); //注意:下面的printf有“\n” printf("ppid=%d, pid=%d, i=%d \n", getppid(), getpid(), i); } sleep(10); //让进程停留十秒,这样我们可以用pstree查看一下进程树 return 0; } [/c] 于是,上面这段程序会输出下面的结果,(注:编译出的可执行的程序名为fork) [shell]ppid=8858, pid=8518, i=0 ppid=8858, pid=8518, i=1 ppid=8518, pid=8519, i=0 ppid=8518, pid=8519, i=1 ppid=8518, pid=8520, i=1 ppid=8519, pid=8521, i=1 $ pstree -p | grep fork |-bash(8858)-+-fork(8518)-+-fork(8519)---fork(8521) | | `-fork(8520)[/shell] 面对这样的图你可能还是看不懂,没事,我好事做到底,画个图给你看看:

注意:上图中的我用了几个色彩,相同颜色的是同一个进程。于是,我们的pstree的图示就可以成为下面这个样子:(下图中的颜色与上图对应)

这样,对于printf(“-“);这个语句,我们就可以很清楚的知道,哪个子进程复制了父进程标准输出缓中区里的的内容,而导致了多次输出了。(如下图所示,就是我阴影并双边框了那两个子进程)

现在你明白了吧。(另,对于图中的我本人拙劣的配色,请见谅!)

(全文完)


另一种解释:

1、

#include <sys/types.h>

#include <stdio.h>

#include <stdlib.h>

int main(){    for(int i=0;i<2;i++){    
    fork();      
    printf("-");  

    }     
    return 0;
}

输出结果为 8个“-”

2、

#include <sys/types.h>

#include <stdio.h>

#include <stdlib.h>

int main(){  

    for(int i=0;i<2;i++){    
    fork();      
    printf("-\n");  

   }     
    return 0;
}

输出结果为 6个“-”

 

很纳闷,为什么一个\n换行符会对输出结果产生影响呢?究其原因就得考究fork函数是如何产生子进程。在执行fork以后,操作系统复制一份当前执行的进程的数据,包括进程的数据空间、堆和栈等,并且在进程表中相应为它建立一个新的表项。上下文也是原进程(父进程)的拷贝。但是父、子进程共享正文段,也就是CPU执行的机器指令部分,这个可共享的,在存储器中只需要一个副本,而且这个副本通常是只读的。所以子进程函数执行点是从父进程中调用fork函数开始往下执行的。关于这一点,理解父子进程关系的话,应该不难理解。而这个\n换行符对输出产生的影响则是和printf函数的缓冲机制有关。当调用printf函数的时候,函数中的输出数据是先被放入缓冲区中,而并没有直接输出到屏幕,直到往缓冲区中压入\n换行符或者是调用了flush之类的函数,才会把数据输出到屏幕。而这个缓冲区在每个子进程都拥有一份副本。所以现在就知道该如何分析了。

首先,先分析没有加\n换行符的函数,i=0时,父进程调用fork函数,此时父进程中的缓冲区中有0个“-”,其子进程2中的上下文与父进程相同,因此子进程将执行1次FOR循环,此时,该进程缓冲区拥有1个“-”,并再次调用fork产生新的子进程3,上下文内容与产生其的父进程相同,也就是缓冲区中拥有一个“-”,但是此时i=1,新产生的子进程将不再执行for循环。回到主进程,也就是一个父进程,父进程将执行两次for循环,第二次for循环将产生一个新的子进程4,其缓冲区中有一个“-”。最后别忘了每一个进程都是从fork调用点开始执行的,所以每个进程都会输出一个“-”,加起来就是8个了。

对于程序2,则在上述分析过程中,注意一下缓冲区中的数据何时被清理,就可以算出结果了。


  • 3
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值