为什么fork函数会返回两次？

nu1lptr

已于 2022-03-03 19:09:09 修改

阅读量336

点赞数

分类专栏： Linux系统编程文章标签： c语言

于 2022-03-03 16:50:46 首次发布

本文链接：https://blog.csdn.net/weixin_40323516/article/details/123258332

版权

Linux系统编程专栏收录该内容

2 篇文章 0 订阅

订阅专栏

在初学多进程时，很容易产生疑问：为什么为什么fork函数会返回两次？

//进程号和进程组相关函数：
 	pid_t getpid(void);			//获取当前进程ID
 	pid_t getppid(void);		//获取当前进程的父进程的ID
 	pid_t getpgid(pid_t pid);	//获取参数pid 指定进程所属的组识别码. 如果参数pid 为0, 则会取得目前进程的组识别码

#include <sys/types.h>
#include <unistd.h>
pid_t fork(void);

Linux man手册中fork函数返回值的说明如下：

On success, the PID of the child process is returned in the parent, and 0 is returned in the child.
On failure, -1 is returned in the parent, no child process is created, and errno is set appropriately.
fork函数作用：用于创建子进程
fork返回值：会返回两次，一次在父进程中，一次在子进程中，在父进程中返回所创建的子进程的ID，在子进程中返回0
    成功：子进程中返回 0，父进程中返回子进程PID
    失败：父进程中返回-1，子进程创建失败，无返回值，errorno被设置
失败的两个主要原因：
   1. 当前系统的进程数已经达到了系统规定的上限，这时 errno 的值被设置为 EAGAIN
   2. 系统内存不足，这时 errno 的值被设置为 ENOMEM

测试代码如下：

#include <sys/types.h>
#include <unistd.h>
#include <stdio.h>

int main() {
    printf("before fork: \n");
    pid_t pid = fork();			//进程从当前位置开始分裂为父进程和子进程，分别开始交替向前并发执行，区分在于pid不同
    printf("after fork: \n");
    if (pid == -1) {
        perror("fork");
    }

    if (pid > 0) {
        printf("pid: %d\n", pid);
        //程序在父进程，返回子进程的pid
        printf("this is parent process, pid: %d, ppid: %d\n",  getpid(), getppid());
    } else if (pid == 0){
        //程序在子进程，它没有子进程，返回0
        printf("this is child process, pid: %d, ppid: %d\n",  getpid(), getppid());
    }

    for (int i = 0; i < 5; i++) {
        printf("i: %d, pid: %d\n", i, getpid());
        sleep(1);
    }

    return 0;
}

输出结果如下：

before fork: 			
after fork: 				#父进程先执行
pid: 146087					#父进程的返回值是子进程的pid
this is parent process, pid: 146086, ppid: 144773
i: 0, pid: 146086			#父进程自己的pid
after fork: 				#子进程开始执行
this is child process, pid: 146087, ppid: 146086 #子进程pid, ppid
i: 0, pid: 146087  				#子进程pid		linux时间片为4ms~500ms
i: 1, pid: 146086				#父进程pid
i: 1, pid: 146087
i: 2, pid: 146086
i: 2, pid: 146087
i: 3, pid: 146086
i: 3, pid: 146087
i: 4, pid: 146086
i: 4, pid: 146087

为什么fork函数会返回两次：

当程序执行到下面的语句： pid=fork(); 由于在复制时复制了父进程的堆栈段，所以两个进程都停留在fork函数中，等待返回。因此fork函数会返回两次，一次是在父进程中返回，另一次是在子进程中返回，这两次的返回值是不一样的。 fork调用的一个奇妙之处就是它仅仅被调用一次，却能够返回两次，它可能有三种不同的返回值：　 1）在父进程中，fork返回新创建子进程的进程ID； 2）在子进程中，fork返回0； 3）如果出现错误，fork返回一个负值。

我们可以通过fork返回的值来判断当前进程是子进程还是父进程。引用一位网友的话来解释fork函数返回的值为什么在父子进程中不同。“ 其实就相当于链表，进程形成了链表，父进程的fork函数返回的值指向子进程的进程id, 因为子进程没有子进程，所以其fork函数返回的值为0 .

调用fork之后，数据、堆、栈有两份，代码仍然为一份但是这个代码段成为两个进程的共享代码段都从fork函数中返回。当父子进程有一个想要修改数据或者堆栈时，两个进程真正分裂。

子进程代码是从fork处开始执行的，为什么不是从#include处开始复制代码的？这是因为fork是把进程当前的情况拷贝一份，执行fork时，进程已经执行完了int count=0; fork只拷贝下一个要执行的代码到新的进程。

程序执行过程图解如下：

实际上，更准确来说，Linux的fork() 使用是通过写时拷贝(copy- on-write)实现的 , 写时拷贝是种可以推迟甚至避免拷贝数据的技术。内核在fork后并不立即复制整个进程的地址空间，而是让父子进程共享同一个地址空间。只用在需要写入的时候才会复制地址空间，从而使各个进行拥有各自的地址空间（刚开始读的时候并不复制）。也就是说，资源的复制是在需要写入的时候才会进行，在此之前，只有以只读方式共享。注意: fork之后父子进程共享文件， fork产生的子进程与父进程相同的文件文件描述符指向相同的文件表，引用计数增加，共享文件偏移指针。