Linux下fork函数详解与实战-CSDN博客

本文详细介绍了Linux中的fork函数，包括fork的作用、特点、返回值以及父子进程的调用流程。通过示例展示了如何使用fork创建并管理进程，同时提到了进程间的相似与不同之处，以及写时拷贝技术在进程复制中的应用。文章最后提醒读者注意并发执行时可能出现的不确定性，并鼓励读者互动交流。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

首先了解什么是fork?

一个进程，包括代码、数据和分配给进程的资源。fork（）函数通过系统调用创建一个与原来进程几乎完全相同的进程，也就是两个进程可以做完全相同的事，但如果初始参数或者传入的变量不同，两个进程也可以做不同的事。
一个进程调用fork（）函数后，系统先给新的进程分配资源，例如存储数据和代码的空间。然后把原来的进程的所有值都复制到新的新进程中，只有少数值与原来的进程的值不同。

上面的话通俗理解就是: fork是复制进程的函数，程序一开始就会产生一个进程，当这个进程(代码)执行到fork()时，fork就会复制一份原来的进程即就是创建一个新进程,我们称子进程，而原来的进程我们称为父进程，此时父子进程是共存的，他们一起向下执行代码。

注意的一点：就是调用fork函数之后，一定是两个进程同时执行fork函数之后的代码，而之前的代码以及由父进程执行完毕。

fork的特点:

首先明白linux中:

PID表示的进程号,是唯一的，一个PID只标识一个进程

PCB:进程控制块,进程控制块是用一个结构体struct task_struct来实现

fork的返回值问题:

在父进程中，fork返回新创建子进程的进程ID；

在子进程中，fork返回0；

如果出现错误，fork返回一个负值；

getppid():得到一个进程的父进程的PID;

getpid():得到当前进程的PID;

*注意:在fork函数执行完毕后，如果创建新进程成功，则出现两个进程，一个是子进程，一个是父进程。在子进程中，fork函数返回0，在父进程中，fork返回新创建子进程的进程ID。我们可以通过fork返回的值来判断当前进程是子进程还是父进程。

fork是把已有的进程复制一份,当然把PCB也复制了一份,然后申请一个PID

子进程的PID=父进程的PID+1;

下面我们举一个简单的例子:

第一次看的时候非常的奇怪，一个函数返回两次？是的，在调用fork后，fork函数后面的所有代码会执行两遍。

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
/**
 *最基础的fork例子
 **/
int main(int argc, char const *argv[])
{
    pid_t pid;
    //判断1
    if ((pid=fork()) < 0)
    {
        perror("fork error");
    }
    //判断2
    else if (pid == 0)//子进程
    {
         printf("child getpid()=%d\n", getpid());
    }
    //判断3
    else if(pid > 0)//父进程
    {
        printf("parent getpid()=%d\n", getpid());
    }

    return 0;
}

结果如下:

parent getpid()=13725
child getpid()=13726

两个判断的代码都执行了，这是非常不可思议的，但fork函数确实实现了这样的功能。也就是在fork函数后面的代码都会执行2遍。这就是为什么两个判断都会被执行的原因。
现在来梳理一下成功fork的执行流程
第一步： pid=fork()，如果成功那么pid就有一个非0正值。否则返回-1。
第二步：因为pid>0，所以进入判断3。这是在父进程。
第三步：父进程的代码执行完了，程序又会把fork后面的函数再执行一遍，此时pid的值变为0，所以进入判断2。

*注意:这里的pid_t类似一个类型，就像int型一样，int型定义的变量都是整型的，pid_t定义的类型都是进程号类型。这个语句的意思是定义了一个pid_t类型的变量pid，fork()函数返回一个进程号，这个进程号赋给了pid。pid_t在头文件types.h（sys/types.h）中定义

pid_t就是一个short类型变量，实际表示的是内核中的进程表的索引

试试判断下面代码:

  #include<stdio.h>
  #include<stdlib.h>
  #include<unistd.h>
   
   int main()
   {
      pid_t fpid;//fpid表示fork函数返回的值
      int count=0;
      fpid=fork();
      if(fpid<0)
          printf("error in fork!");
      else if(fpid==0)
      {
          printf("我是子进程,id:%d\n",getpid());
          count++;
      }
      else
      {
          printf("我是父进程,id:%d\n",getpid());
          count++;
      }
      printf("统计结果是:%d\n",count);
      exit(0);
  }

父子进程的调用流程:

下面我们讲解一下fork调用的细节

int main(){
	fork();//fork1
	fork();//fork2
	printf("love\n");
	return 0;
}

上述代码打印了4次love，创建了4个进程（1一个父进程，3个子进程）

假设我们的main进程pid是1001，注意看左边的1，2，4进程其实都是main进程1001。进程3，6是同一个进程1002。所有一共有1001，1002，1003，1004四个进程。也就是只要数叶子节点就行了。其中1个是main进程，其它3个是子进程。有多少个进程就输出多少次hello字符串。也就是只有4，5，6，7执行了printf。

如果明白了上面的过程下面我给出四个例子和解释，可以自己先试着判断

eg1:
int main()
{
    int n=2;
    for(;i<n;i++)
    {
        fork();
        printf("A\n");//遇到\n会自动刷新缓冲区
    }
    exit(0);
}
eg2:
int main()
{
    int n=2;
    for(;i<n;i++)
    {
        fork();
        printf("-");//不会刷新缓冲区
    }
    exit(0);
}
eg3:
int main()
{
	fork()||fork();
	printf("A\n");
	exit(0);
	1）在父进程中，fork返回新创建子进程的进程ID；大于0的
    2）在子进程中，fork返回0；
    3）如果出现错误，fork返回一个负值；
}
结果打印3个A，共创建3个进程

fork()给子进程返回一个零值，而给父进程返回一个非零值

在main这个主进程中，首先执行 fork() || fork(), 左边的fork()返回一个非零值，根据||的短路原则，前面的表达式为真时，后面的表达式不执行，故包含main的这个主进程创建了一个子进程，

由于子进程会复制父进程，而且子进程会根据其返回值继续执行，就是说，在子进程中， fork() ||fork()这条语句左边表达式的返回值是0, 所以||右边的表达式要执行，这时在子进程中又创建了一个进程，

即main进程->子进程->子进程，一共创建了3个进程。

eg4:
int main()
{
	fork()&&fork();
	printf("A\n");
	exit(0);
}
结果输出3个A，创建3个进程

注意小tips:

父子进程相同：

刚刚fork后，data段，text段，堆，栈，环境变量，全局变量，宿主目录位置，进程工作目录，信号处理方式

父子进程不同：

进程id，返回值，各自父进程，进程创建时间，闹钟，未决信号

父子进程共享：

文件描述符
mmap映射区
读时共享，写时复制-----------------全局变量

对fork复制进程做了一个优化----写时拷贝技术。写时拷贝指的是两个任务可以同时自由读取内存，但任意一个任务试图对内存进行修改时，内存就会复制一份提供给修改方单独使用，以免影响到其他的任务使用。

特别的，fork之后父进程先执行还是子进程先执行不确定，取决于内核所使用的调度算法。

注意父进程多次fork后不加以控制，我们会发现打印结果不唯一，无序。是因为对于操作系统将代码交给cpu执行的时候产生的子进程相当于同时产生的，并发运行，他们站在同一起跑线上去争夺cpu，谁抢到了谁就去运行打印数据，这是与系统调度有关，想让他们有序，可以加入sleep函数让其休眠一下