问题
在笔试中经常会看到关于fork()函数的问题。之前在分析时都只能分析对一半,故此在这里整理一下。
#include <stdio.h>
#include <unistd.h>
int main()
{
int i;
for (i = 0; i < 3; i++) {
fork();
printf("K");
/* printf("K\n"); // 两者之间的区别 */
}
return 0;
}
问上述代码中,K输出的个数?
分析
我们都知道fork()函数是Linux下创建进程的函数,它通过复制调用进程来创建一个新的进程,新进程被称为子进程,调用进程称为父进程。当调用成功时,这个函数有个特点是调用一次返回两次。因此可以得出下面在执行之后进程个数如下图所示:
- 当循环第一次时,新建一个进程,共计两个进程,输出两个字符K。
- 当循环第二次时,新建两个进程,共计四个进程,输出四个字符K。
- 当循环第三次时,新建四个进程,共计八个进程,输出八个字符K。
- 程序结束,共计输出 2+4+8=14 个字符K。
通常,我分析到这里就结束了,通过总结可以得出K的个数为 2n+1−2 (满二叉树节点个数减去根节点),其中n为循环次数。因此上述代码将输出14个K,然而,当真实运行时,输出结果远不止14个K,这是为什么呢?其实这里面还隐含了一个细节,关于printf()函数的细节,默认情况下,printf()函数采用行输出缓冲区,即printf()是将输出字符串存放到输出缓冲区当中,只有在缓冲区满,或者遇到换行符或主动刷新缓冲区时才会输出缓冲区内容。
在创建子进程时,由于是通过复制父进程而来的,因此子进程会将printf()函数的缓冲区一并复制下来。这就造成了结果的不同。
- 当第一次循环时,输出缓冲区为空,接着子进程和父进程分别向输出缓冲区中输出字符K。此时,每个进程中有一个字符K,合计两个进程,共计2个字符K。
- 当第二次循环时,父进程和子进程分别创建一个进程,并获得输出缓冲区中的一个字符K,接着每个进程再向输出缓冲区中输出一个字符K,此时,每个进程中有二个字符K,合计四个进程,共计8个字符K。
- 当第三次循环时,四个进程分别又创建一个子进程,获得了输出缓冲区中的二个字符K,接着每个进程再向输出缓冲区中输出一个字符K,此时,每个进程中有三个字符K,合计八个进程,共计24个字符K。
- 以此类推,可以得到,当n次循环后,有 2n 个进程,每个进程中有n个字符,共计 2n∗n 个字符K(注意:在没有达到行缓冲区大小之前。)。
总结
- 在printf()函数输出中加上换行符,输出个数为 2n+1−2 次。
- 在printf()函数输出中不加换行符,输出个数为 2n∗n 次(备注:不超过行缓冲区大小的前提下)。