进程控制(创建、等待、终止、替换)

fork函数
在linux中fork函数时非常重要的函数,它从已存在进程中创建一个新进程。新进程为子进程,而原进程为父进程。

#include <unistd.h>
pid_t fork(void);
返回值:自进程中返回0,父进程返回子进程id,创建失败返回-1

当fork之后,它大概是怎样控制的呢?
在这里插入图片描述
如图解,也就清晰许多了。
在这里插入图片描述
运行结果在这里插入图片描述

上面这段代码就是一个进程创建了一个子进程的例子。父进程输出i am father,子进程输出子进程pid.
那么具体实现是怎样的呢?
在这里插入图片描述
fork后由系统内核创建新的进程,而作为一个进程他就有必要的代码逻辑和数据,他就有占用资源,例如代码,数据,虚拟地址空间等。而作为子进程他的代码是和父进程共享的,数据是各自私有。
为什么是这样呢?
首先父进程创建了子进程,子进程代码会和父进程一样,代码都储存在代码区里是不能被修改的,所以父子进程共享一段代码会节省一份空间。既然代码一样的,上述代码为例子,那为什么子进程没有输出前面那个fid,并且再fork陷入循环呢?因为子进程在创建好后系统会为其分配好资源,并将fork完成时父进程的状态数据拷贝给子进程如程序计数器(标识程序走到哪),所以,创建好的子进程也就执行到了fork之后得到fork返回值这步。
然后,进程间是有独立性的,那么他们子进程的数据和父进程的数据是要各自私有的,但是是要给子进程重新分配虚拟地址空间,页表,物理空间吗?
不是的,以为子进程可能不一定要修改从父进程哪里继承来的数据,要是不改变数据的话,父子进程是不是共有一段数据就行了,这样可以节省空间,这就引入了写时拷贝。
通常,父子代码共享,父子再不写入时,数据也是共享的,当任意一方试图写入,便以写时拷贝的方式各自一份副本。具体见下图在这里插入图片描述
这样分析,首先父进程拷贝数据给子进程后,拷贝的所有数据都置为只读状态,然后父子进程都是指向同一个数据空间的,当父或子进程中的一个先修改某个数据时会发生错误,然后系统会处理这错误,会将重新修改修改数据的这个进程页表的映射关系(开辟新的空间,建立这个进程修改的数据的虚拟地址映射关系,再更该权限)。
只有修改数据时才开辟新空间,这样就可以节省不必要的浪费。
fork常用法

  • 一个父进程希望复制自己,使父子进程同时执行不同的代码段。例如,父进程等待客户端请求,生成子进程来处理请求。
  • 一个进程要执行一个不同的程序。例如子进程从fork返回后,调用exec函数

fork调用失败的原因

  • 系统中有太多的进程
  • 实际用户的进程数超过了限制

所以如何理解子进程创建呢?
多了个进程,OS就要对他管理起来,会为其创建相应的结构体如进程控制块PCB,为其分配资源。
当一个进程结束时会有那些状态呢?

跑完代码,结果对(正常结束)
跑完代码,结果不对(比如程序执行了一些错误的操作)
没跑完代码程序异常结束(崩溃)

既然有这些状态,那我们怎样知道进程是怎么结束的,这些相关的状态要怎样标识呢?
这就要靠进程的退出码了,这些状态信息在PCB里都会存储的。
退出码是啥,我们平常写的main函数的return 0;结束时返回的0可以是退出码,所以写代码的时候,分析不同的情况,然后写好对应意义的退出码。
常见退出方法(正常结束)

从main返回
调用exit
_exit

异常退出

ctrl + c,信号终止

_exit函数

#include <unistd.h>
void _exit(int status);
参数:status 定义了进程的终止状态,父进程通过wait来获取该值
说明:虽然status是int,但是仅有低8位可以被父进程所用。所以_exit(-1)时,在终端执行$?发现返回值是255。

exit函数

参数为退出码
exit最后也会调用exit, 但在调用exit之前,还做了其他工作:

  1. 执行用户通过 atexit或on_exit定义的清理函数。
  2. 关闭所有打开的流,所有的缓存数据均被写入
  3. 调用_exit

注意:
return只有在main时才能终止进程,exit无论在哪都会终止进程
看个例子
在这里插入图片描述
echo $?获取最近结束进程退出码
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
观察到这退出码是exit的参数或者main函数里return的返回值

子进程创建出来,是父进程先运行还是子进程先运行呢?这是由调度器说了算的。但是一般情况下,子进程都是要先于父进程结束的。因为父进程要获取到子进程的信息已得到它的退出码和执行结果。但是子进程先退出了,那么他的资源都会立即释放码?前面也讲过僵尸进程,僵尸进程就是子进程结束了,但父进程没有对其资源回收,就会造成一定的空间浪费。当子进程结束时,会释放一部分资源,如页表,虚拟空间这些等,但是他的进程控制块里有这个进程的状态信息等,并不会被释放,操作系统会维护就会造成一定的浪费,这就是僵尸状态。要解决这个问题就需要父进程来获取这些如退出码,了解到他是怎样终止的,然后才能释放这部分些资源。
进程等待
那么,为了防止有僵尸进程产生我们就需要在子进程结束的时候让父进程去获取他的退出状态,回收子进程的资源。
所以父进程需要监控子进程是否结束进程(通过退出码或者信号),所以父进程需要放下手中的事来等待子进程结束,然后获取子进程退出码,最后释放掉子进程未释放的资源。
进程等待的方法
wait方法

#include<sys/types.h>
#include<sys/wait.h>
pid_t wait(int*status);
返回值:
成功返回被等待进程pid,失败返回-1。
参数:
输出型参数,获取子进程退出状态,不关心则可以设置成为NULL

waitpid方法

#include<sys/types.h>
#include<sys/wait.h>
pid_t wait(int*status);
返回值:
成功返回被等待进程pid,失败返回-1。
参数:
输出型参数,获取子进程退出状态,不关心则可以设置成为NULL
pid_ t waitpid(pid_t pid, int *status, int options);
返回值:
当正常返回的时候waitpid返回收集到的子进程的进程ID;
如果设置了选项WNOHANG,而调用中waitpid发现没有已退出的子进程可收集,则返回0;
如果调用中出错,则返回-1,这时errno会被设置成相应的值以指示错误所在;
参数:
pid:
Pid=-1,等待任一个子进程。与wait等效。
Pid>0.等待其进程ID与pid相等的子进程。
status:
WIFEXITED(status): 若为正常终止子进程返回的状态,则为真。(查看进程是否是正常退出)
WEXITSTATUS(status): 若WIFEXITED非零,提取子进程退出码。(查看进程的退出码)
options:
WNOHANG: 若pid指定的子进程没有结束,则waitpid()函数返回0,不予以等待。若正常结束,则返回该子进程的ID。

如果子进程已经退出,调用wait/waitpid时,wait/waitpid会立即返回,并且释放资源,获得子进程退出信息。
如果在任意时刻调用wait/waitpid,子进程存在且正常运行,则进程可能阻塞。
如果不存在该子进程,则立即出错返回。

举例再父进程执行wait(NULL)函数后,就会变成阻塞状态直到子进程终止,然后释放子进程资源。
waitpid有三个参数pid_ t waitpid(pid_t pid, int *status, int options);
第一个参数传的是要等待进程的pid,第二个是会读取进程退出是的状态(也就是进程退出时,退出状态会保存在这里),第三个为等待方式。
获取子进程status

wait和waitpid,都有一个status参数,该参数是一个输出型参数,由操作系统填充。
如果传递NULL,表示不关心子进程的退出状态信息。
否则,操作系统会根据该参数,将子进程的退出信息反馈给父进程。
status不能简单的当作整形来看待,可以当作位图来看待,具体细节如下图(只研究status低16比特位):

status参数是保存进程退出信息的
下图表示代码走完和代码没走完进程终止status参数
在这里插入图片描述
这个参数虽然是int,但是它只是用低16位,而低16位里的高8位就表示退出码即保存(上面说的return和exit的值)低16位的低8位值为0时表示正常终止,否则为信号终止,然后就不用没有退出码,所以低16位的高8为不用。
所以父进程可以通过这个参数来判断子进程终止的状态。获取后就释放掉管理子进程的相应数据结构等。
进程程序替换
到目前为止,我们用fork()创建子进程都只是相当于在父进程代码上构造一个新的进程,,那么我们能不能创建进程的时候不用父进程而用一些想用的进程呢?
替换函数
其实有六种以exec开头的函数,统称exec函数

#include <unistd.h>`
int execl(const char *path, const char *arg, …);
int execlp(const char *file, const char *arg, …);
int execle(const char *path, const char *arg, …,char *const envp[]);
int execv(const char *path, char *const argv[]);
int execvp(const char *file, char *const argv[]);

虽然有6个函数,但是他们功能都差不多的,只是传参方式不太一样。
函数传参有两种方式:列表和非列表。

void fun(char* a,char* b,char *c)
fun(a,b,c);//列表传参

void (char* a[])//非列表
char* a = {s1,s2,s3};
fun(a);

所以上面函数带v的是非列表传参,其余是列表传参
带l的是可变传参如printf()函数里面的参数个数是不定的
这些函数第一个参数传的是要替换进程的路径,而带p的话表示直接传进程名就行了,他会从环境变量里找。
至于后面的参数都是要传的命令
举例
在这里插入图片描述

在这里插入图片描述
用法如上,结合前面所说就理解了吧(环境变量里的ls=/usr/bin/ls)所以传环境变量也相当于传路径。
分析下运行结果:
执行第一个cout后就执行了ps指令,然后没有执行第二个cout,这是为什么?
因为执行execlp后,系统会将ps这个程序加载到内存中,他的代码会覆盖原来进程的代码,数据,虚拟空间,页表等也会直接覆盖,如图
在这里插入图片描述

替换原理

用fork创建子进程后执行的是和父进程相同的程序(但有可能执行不同的代码分支),子进程往往要调用一种exec函数
以执行另一个程序。当进程调用一种exec函数时,该进程的用户空间代码和数据完全被新程序替换,从新程序的启动例程开始执行。调用exec并不创建新进程,所以调用exec前后该进程的id并未改变

所以想想,我们就可以用fork和excl函数写一个简单的bash(命令行解释器)。
当我们要保证父进程的安全,就可以用fork创建子进程去完成想要弄的功能(如执行一些逻辑,替换进程)就算这些会导致进程崩溃,但是这只是子进程崩溃,然后父进程只需要获取退出码等一些信息还有释放资源就行了。
总结
创建进程后,会为这个进程分配资源(管理他的相应数据结构,代码逻辑数据等)。当进程终止后会有三种状态:代码走完,程序执行正确,和程序执行错误;还有代码没走完,程序异常终止(由信号终止)。子进程未终止时父进程会处于阻塞等待状态,直到子进程结束,父进程读取到子进程退出状态并释放资源。进程替换,执行exec后,会将目标进程的代码数据加载到这个进程的虚拟空间中。但是这一过程将会丢弃旧有程序,旧进程虚拟地址空间将被初始化,更新页表,pcb等相关信息。但是pid不变,因为他还是原来的进程,并没有创建新的进程,运行队列里没有添加新进程。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值