fork() 问题

前两天有人问了个关于Unix的fork()系统调用的面试题,这个题正好是我大约十年前找工作时某公司问我的一个题,我觉得比较有趣,写篇文章与大家分享一下。这个题是这样的:

题目:请问下面的程序一共输出多少个“-”?

1
2
3
4
5
6
7
8
9
10
11
12
13
14
#include <stdio.h>
#include <sys/types.h>
#include <unistd.h>
 
int main( void )
{
    int i;
    for (i=0; i<2; i++){
       fork();
       printf ( "-" );
    }
 
    return 0;
}

如果你对fork()的机制比较熟悉的话,这个题并不难,输出应该是6个“-”,但是,实际上这个程序会很tricky地输出8个“-”。

要讲清这个题,我们首先需要知道fork()系统调用的特性,

●fork()系统调用是Unix下以自身进程创建子进程的系统调用,一次调用,两次返回,如果返回是0,则是子进程,如果返回值>0,则是父进程(返回值是子进程的pid),这是众为周知的。

●还有一个很重要的东西是,在fork()的调用处,整个父进程空间会原模原样地复制到子进程中,包括指令,变量值,程序调用栈,环境变量,缓冲区,等等。

所以,上面的那个程序为什么会输入8个“-”,这是因为printf(“-”);语句有buffer,所以,对于上述程序,printf(“-”);把“-”放到了缓存中,并没有真正的输出(参看《C语言的迷题》中的第一题),在fork的时候,缓存被复制到了子进程空间,所以,就多了两个,就成了8个,而不是6个。

另外,多说一下,我们知道,Unix下的设备有“块设备”和“字符设备”的概念,所谓块设备,就是以一块一块的数据存取的设备,字符设备是一次存取一个字符的设备。磁盘、内存都是块设备,字符设备如键盘和串口。块设备一般都有缓存,而字符设备一般都没有缓存

对于上面的问题,我们如果修改一下上面的printf的那条语句为:

1
printf ( "-n" );

或是

1
2
printf ( "-" );
fflush (stdout);

就没有问题了(就是6个“-”了),因为程序遇到“n”,或是EOF,或是缓中区满,或是文件描述符关闭,或是主动flush,或是程序退出,就会把数据刷出缓冲区。需要注意的是,标准输出是行缓冲,所以遇到“n”的时候会刷出缓冲区,但对于磁盘这个块设备来说,“n”并不会引起缓冲区刷出的动作,那是全缓冲,你可以使用setvbuf来设置缓冲区大小,或是用fflush刷缓存。

我估计有些朋友可能对于fork()还不是很了解,那么我们把上面的程序改成下面这样:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
#include <stdio.h>
#include <sys/types.h>
#include <unistd.h>
int main( void )
{
    int i;
    for (i=0; i<2; i++){
       fork();
       //注意:下面的printf有“n”
       printf ( "ppid=%d, pid=%d, i=%d n" , getppid(), getpid(), i);
    }
    sleep(10); //让进程停留十秒,这样我们可以用pstree查看一下进程树
    return 0;
}

于是,上面这段程序会输出下面的结果,(注:编译出的可执行的程序名为fork)

1
2
3
4
5
6
7
8
9
ppid=8858, pid=8518, i=0
ppid=8858, pid=8518, i=1
ppid=8518, pid=8519, i=0
ppid=8518, pid=8519, i=1
ppid=8518, pid=8520, i=1
ppid=8519, pid=8521, i=1
 
$ pstree -p | grep fork
|- bash (8858)-+-fork(8518)-+-fork(8519)---fork(8521)

面对这样的图你可能还是看不懂,没事,我好事做到底,画个图给你看看:

 

注意:上图中的我用了几个色彩,相同颜色的是同一个进程。于是,我们的pstree的图示就可以成为下面这个样子:(下图中的颜色与上图对应)

陈皓:一个 fork 的面试题

这样,对于printf(“-”);这个语句,我们就可以很清楚的知道,哪个子进程复制了父进程标准输出缓中区里的的内容,而导致了多次输出了。(如下图所示,就是我阴影并双边框了那两个子进程)

陈皓:一个 fork 的面试题

现在你明白了吧。(另,对于图中的我本人拙劣的配色,请见谅!)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Redis是一个内存数据库,而fork是Linux系统中创建进程的机制。在Redis中使用fork创建子进程时,可能会出现一些问题,需要进行解决。 首先,当Redis使用fork创建子进程时,会复制当前进程的内存空间。这就意味着如果内存空间很大,那么复制的时间和内存消耗都会很高,可能会导致主进程在fork期间变得不可响应。为了解决这个问题,Redis采用了写时复制(Copy-on-Write)的机制。 写时复制是一种延迟复制的策略,在Redis中,当子进程修改某个内存页时,才会进行实际的复制操作。这样可以避免在fork期间进行全部内存的复制,减少了时间和内存的开销。 其次,Redis在使用fork创建子进程时,还会对内存进行压缩操作。这是因为Redis对于大部分数据都是只读的,而只读内存是可以共享的,不需要复制。因此,Redis会将内存中的只读数据进行压缩,减少数据复制的数量,提高性能和效率。 此外,在Redis 3.2及之后的版本中,还引入了RDB文件的延迟写入机制。在fork期间,Redis会将脏数据(未落地的数据)存储到RDB文件中。这样可以减少fork时内存的使用量,提高整体性能。 总的来说,Redis通过采用写时复制、内存压缩和RDB文件的延迟写入机制,解决了在fork时可能出现的性能问题。这使得Redis在fork时可以更高效地使用内存,提高了整体的性能和可靠性。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值