统治世界的缓存 --- glibc源码拜读 - printf

本文通过分析printf源码,探讨了用户态缓冲区的工作原理,解释了为何在子进程复制父进程空间后,输出会被重复。文章详细介绍了glibc如何在用户态建立缓冲区,并在不同情况下决定何时调用系统调用进行实际输出,揭示了缓存在性能优化中的关键作用,如减少系统调用、预读取、写入优化以及内存池等场景的应用。
摘要由CSDN通过智能技术生成

问题由来

有这么一段代码:

int main() {
    printf("aaa\n");
    pid_t pid = fork();
    if (pid < 0) {
        printf("an error occur\n");
    } else if (pid == 0) {
        printf("i am child\n");
    } else {
        sleep(1);
        printf("i am parent\n");
    }
    exit(0);
}

在交互式终端(Terminal)中运行,我们会得到预想的结果:

aaa
i am child
i am parent

但是如果使用输出重定向到文件,比如./test > a.txt,然后查看文件内容cat a.txt,则会得到
这样的结果:

aaa
i am child
aaa
i am parent

为什么aaa被输出了两次呢。

用户态缓冲区

很多人知道printf是有一个自带的缓冲区的,而要给操作系统真正去执行,至少应该调用write系统调用。
而上面的例子,让我们觉得,这个缓冲区是在用户态,fork得到的子进程复制了用户态空间,导致父进程还
未输出的缓存内容也被复制到了子进程。子进程输出后,子进程的缓存被清理,但是父进程的缓存仍然存在。
于是父进程在进程结束前也输出了aaa。于是查看glibc的源代码,试图弄明白这个问题:

int
__printf (const char *format, ...)
{
  va_list arg;
  int done;

  va_start (arg, format);
  done = vfprintf (stdout, format, arg);
  va_end (arg);

  return
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值