fork函数详解

19 篇文章 6 订阅 ¥29.90 ¥99.00
本文详细介绍了Linux中的fork函数,包括fork的作用、特点、返回值以及父子进程的调用流程。通过示例展示了如何使用fork创建并管理进程,同时提到了进程间的相似与不同之处,以及写时拷贝技术在进程复制中的应用。文章最后提醒读者注意并发执行时可能出现的不确定性,并鼓励读者互动交流。
摘要由CSDN通过智能技术生成

首先了解什么是fork?

 

d96e35c8a538ff7b0017047252b92768.png

一个进程,包括代码、数据和分配给进程的资源。fork()函数通过系统调用创建一个与原来进程几乎完全相同的进程,也就是两个进程可以做完全相同的事,但如果初始参数或者传入的变量不同,两个进程也可以做不同的事。
一个进程调用fork()函数后,系统先给新的进程分配资源,例如存储数据和代码的空间。然后把原来的进程的所有值都复制到新的新进程中,只有少数值与原来的进程的值不同。

上面的话通俗理解就是: fork是复制进程的函数,程序一开始就会产生一个进程,当这个进程(代码)执行到fork()时,fork就会复制一份原来的进程即就是创建一个新进程,我们称子进程,而原来的进程我们称为父进程,此时父子进程是共存的,他们一起向下执行代码。

注意的一点:就是调用fork函数之后,一定是两个进程同时执行fork函数之后的代码,而之前的代码以及由父进程执行完毕。

fork的特点:

首先明白linux中:

PID表示的进程号,是唯一的,一个PID只标识一个进程

PCB:进程控制块,进程控制块是用一个结构体struct task_struct来实现

31b49ff7cb964a5b940d5408fe15be37.png

fork的返回值问题:

在父进程中,fork返回新创建子进程的进程ID;

在子进程中,fork返回0;

如果出现错误,fork返回一个负值;  

getppid():得到一个进程的父进程的PID;

getpid():得到当前进程的PID;

*注意:在fork函数执行完毕后,如果创建新进程成功,则出现两个进程,一个是子进程,一个是父进程。在子进程中,fork函数返回0,在父进程中,fork返回新创建子进程的进程ID。我们可以通过fork返回的值来判断当前进程是子进程还是父进程。

fork是把已有的进程复制一份,当然把PCB也复制了一份,然后申请一个PID

子进程的PID=父进程的PID+1;

bf2ba936cfb649ab8c5e0606fabd3af1.png

下面我们举一个简单的例子:

第一次看的时候非常的奇怪,一个函数返回两次?是的,在调用fork后,fork函数后面的所有代码会执行两遍。

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
/**
 *最基础的fork例子
 **/
int main(int argc, char const *argv[])
{
    pid_t pid;
    //判断1
    if ((pid=fork()) < 0)
    {
        perror("fork error");
    }
    //判断2
    else if (pid == 0)//子进程
    {
         printf("child getpid()=%d\n", getpid());
    }
    //判断3
    else if(pid > 0)//父进程
    {
        printf("parent getpid()=%d\n", getpid());
    }

    return 0;
}

结果如下:

parent getpid()=13725
child getpid()=13726

两个判断的代码都执行了,这是非常不可思议的,但fork函数确实实现了这样的功能。也就是在fork函数后面的代码都会执行2遍。 这就是为什么两个判断都会被执行的原因。
现在来梳理一下成功fork的执行流程
第一步: pid=fork(),如果成功那么pid就有一个非0正值。否则返回-1。
第二步: 因为pid>0,所以进入判断3。这是在父进程。
第三步: 父进程的代码执行完了,程序又会把fork后面的函数再执行一遍,此时pid的值变为0,所以进入判断2。

*注意:这里的pid_t类似一个类型,就像int型一样,int型定义的变量都是整型的,pid_t定义的类型都是进程号类型。这个语句的意思是定义了一个pid_t类型的变量pid,fork()函数返回一个进程号,这个进程号赋给了pid。pid_t在头文件types.h(sys/types.h)中定义

pid_t就是一个short类型变量,实际表示的是内核中的进程表的索引

试试判断下面代码:

  #include<stdio.h>
  #include<stdlib.h>
  #include<unistd.h>
   
   int main()
   {
      pid_t fpid;//fpid表示fork函数返回的值
      int count=0;
      fpid=fork();
      if(fpid<0)
          printf("error in fork!");
      else if(fpid==0)
      {
          printf("我是子进程,id:%d\n",getpid());
          count++;
      }
      else
      {
          printf("我是父进程,id:%d\n",getpid());
          count++;
      }
      printf("统计结果是:%d\n",count);
      exit(0);
  }

4daf60e5731e4d37bb893cee07fe533c.png

 父子进程的调用流程:

下面我们讲解一下fork调用的细节

int main(){
	fork();//fork1
	fork();//fork2
	printf("love\n");
	return 0;
}

上述代码打印了4次love,创建了4个进程(1一个父进程,3个子进程)

581bff9bef734e929209386343aaf074.png

假设我们的main进程pid是1001,注意看左边的1,2,4进程其实都是main进程1001。进程3,6是同一个进程1002。所有一共有1001,1002,1003,1004四个进程。也就是只要数叶子节点就行了。其中1个是main进程,其它3个是子进程。有多少个进程就输出多少次hello字符串。也就是只有4,5,6,7执行了printf。

如果明白了上面的过程下面我给出四个例子和解释,可以自己先试着判断

eg1:

int main()
{
    int n=2;
    for(;i<n;i++)
    {
        fork();
        printf("A\n");//遇到\n会自动刷新缓冲区
    }
    exit(0);
}

13a43ca4f51348fe8a67ed2d30f9ca0a.png

eg2:

int main()
{
    int n=2;
    for(;i<n;i++)
    {
        fork();
        printf("-");//不会刷新缓冲区
    }
    exit(0);
}

eg3:

int main()
{
	fork()||fork();
	printf("A\n");
	exit(0);
	1)在父进程中,fork返回新创建子进程的进程ID;大于0的
    2)在子进程中,fork返回0;
    3)如果出现错误,fork返回一个负值;
}

结果打印3个A,共创建3个进程

fork()给子进程返回一个零值,而给父进程返回一个非零值

在main这个主进程中,首先执行 fork() || fork(), 左边的fork()返回一个非零值,根据||的短路原则,前面的表达式为真时,后面的表达式不执行,故包含main的这个主进程创建了一个子进程,

由于子进程会复制父进程,而且子进程会根据其返回值继续执行,就是说,在子进程中, fork() ||fork()这条语句 左边表达式的返回值是0, 所以||右边的表达式要执行,这时在子进程中又创建了一个进程,

即main进程->子进程->子进程,一共创建了3个进程。

a491461cc6934bf3ad3d73a20a5c971e.png  

eg4:

int main()
{
	fork()&&fork();
	printf("A\n");
	exit(0);
}

结果输出3个A,创建3个进程

57c3ee87567647afa62ab471f2ad2624.png

注意小tips:

父子进程相同:

  • 刚刚fork后,data段,text段,堆,栈,环境变量,全局变量,宿主目录位置,进程工作目录,信号处理方式

父子进程不同:

  • 进程id,返回值,各自父进程,进程创建时间,闹钟,未决信号

父子进程共享:

  • 文件描述符
  • mmap映射区
  • 读时共享,写时复制-----------------全局变量

对fork复制进程做了一个优化----写时拷贝技术。写时拷贝指的是两个任务可以同时自由读取内存,但任意一个任务试图对内存进行修改时,内存就会复制一份提供给修改方单独使用,以免影响到其他的任务使用。

特别的,fork之后父进程先执行还是子进程先执行不确定,取决于内核所使用的调度算法。

注意父进程多次fork后不加以控制,我们会发现打印结果不唯一,无序。是因为对于操作系统将代码交给cpu执行的时候产生的子进程相当于同时产生的,并发运行,他们站在同一起跑线上去争夺cpu,谁抢到了谁就去运行打印数据,这是与系统调度有关,想让他们有序,可以加入sleep函数让其休眠一下

看到这里相信对与fork就有了基本的了解,点赞收藏是对博主最大的支持!有任何问题欢迎评论区留言讨论! 

f4fc38606e44ae26d8a9ebd2e258abf5.png

往期回顾:Linux常用命令及操作演示(细节满满)

  • 393
    点赞
  • 1341
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 43
    评论
Java JDK环境变量配置是为了确保计算机上的Java开发环境正常运行。首先,确保电脑上已经安装了JDK(Java Development Kit),因为JDK是Java的基本运行环境。环境变量是指在操作系统中设置的一些参数,可以用来指定一些程序的运行条件。在配置Java JDK环境变量之前,需要先进行JDK的安装。 JDK的安装分为两个步骤:首先,安装JDK本身;其次,安装JRE(Java Runtime Environment)。请注意,当安装JDK的时候,JRE也会一同安装。在安装JDK的过程中,可以选择安装目录,一般默认为C盘的Java文件夹,但你也可以根据自己的需要修改安装目录。 在完成JDK的安装后,需要配置环境变量。其中最重要的是配置JAVA_HOME和CLASS_PATH两个变量。JAVA_HOME变量指向JDK的安装目录,而CLASS_PATH变量用于指定Java类的搜索路径。 配置JAVA_HOME变量时,将其值设置为JDK的安装目录即可。比如,如果JDK安装在C盘的Java文件夹下,那么JAVA_HOME的值就应该设置为C:\Java。 配置CLASS_PATH变量时,需要将其值设置为以下内容:.;%JAVA_HOME%\lib;%JAVA_HOME%\lib\tools.jar。这些路径将用于指定Java类的搜索路径,以便程序可以正确地找到所需的类文件。 请注意,在配置环境变量时,需要确保使用正确的语法和路径,以免出现错误。完成环境变量的配置后,就可以在计算机上正常运行Java程序了。希望这些信息能对你有所帮助。<span class="em">1</span><span class="em">2</span><span class="em">3</span><span class="em">4</span>
评论 43
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

BearPot

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值