问题由来
有这么一段代码:
int main() {
printf("aaa\n");
pid_t pid = fork();
if (pid < 0) {
printf("an error occur\n");
} else if (pid == 0) {
printf("i am child\n");
} else {
sleep(1);
printf("i am parent\n");
}
exit(0);
}
在交互式终端(Terminal)中运行,我们会得到预想的结果:
aaa
i am child
i am parent
但是如果使用输出重定向到文件,比如./test > a.txt
,然后查看文件内容cat a.txt
,则会得到
这样的结果:
aaa
i am child
aaa
i am parent
为什么aaa
被输出了两次呢。
用户态缓冲区
很多人知道printf
是有一个自带的缓冲区的,而要给操作系统真正去执行,至少应该调用write
系统调用。
而上面的例子,让我们觉得,这个缓冲区是在用户态,fork
得到的子进程复制了用户态空间,导致父进程还
未输出的缓存内容也被复制到了子进程。子进程输出后,子进程的缓存被清理,但是父进程的缓存仍然存在。
于是父进程在进程结束前也输出了aaa
。于是查看glibc
的源代码,试图弄明白这个问题:
int
__printf (const char *format, ...)
{
va_list arg;
int done;
va_start (arg, format);
done = vfprintf (stdout, format, arg);
va_end (arg);
return