进程控制之进程等待

zhengyawen666

于 2022-10-06 22:53:07 发布

阅读量686

点赞数

分类专栏： linux 文章标签： linux

本文链接：https://blog.csdn.net/zhengyawen666/article/details/127186834

版权

linux 专栏收录该内容

23 篇文章 0 订阅

订阅专栏

一为什么要进行进程等待

1 防止内存泄漏

进程退出，如果父进程不管子进程，子进程就会处于僵尸状态，长时间的僵尸状态会导致内存泄漏。因为没人去回收这个子进程，但是子进程却需要占用资源进行维护。（虽然说如果最后该子进程的父进程也挂掉了之后，就会被操作系统回收。但是大多数情况下这个进程一旦被运行起来，一般都会成为常驻进程，一直在后台运行的。）

2 得知子进程的状态

父进程创建了子进程，是要让子进程办事的，那么子进程把任务完成的怎么样，父进程需要关心的

。并且子进程把任务完成的怎么样，是用之前进程终止的三种情况来标定的。那么子进程如果可以返回上述相关结果的状态，并且让父进程获取到，那么父进程就可以得知子进程把事情办得怎么样了。

因此，父进程了解子进程的状态，回收僵尸状态，都需要通过进程等待来完成。怎么完成呢？就是通过进程等待。进程等待通过让父进程回收子进程，释放子进程相关资源（数据代码和相关的数据结构），并且获得子进程的退出结果，进而指导接下来的工作。

由此看来，进程等待是很有必要的。

需要注意的是：

思考以下问题：如果一个程序在写代码的时候存在内存泄漏的问题，那么如果该程序被运行起来成为了一个进程，该进程退出后，还存在内存泄漏吗？

malloc或者new出来的一块空间，最终进程退出由操作系统自动回收了。所以这是不存在内存泄漏的。

但是如果子进程退出，已经处于僵尸状态，这样的话就并没有随着系统退出而回收资源。

差别：new和malloc在堆上申请空间，僵尸进程本质上是属于操作系统层面的内存泄漏。

所以进程等待是有必要的。进程等待专门用来处理这种僵尸进程引起的内存泄漏。

但是如果父进程不需要获取子进程的状态，并且父进程运行时间很短，也可以不处理僵尸进程。

二如何进程等待

既然进程等待是很有必要的，那么如何进行对应的操作呢？这里有两种方法：wait和waitpid。这两个函数都可以用来进行进程等待，获取子进程退出时候的一些信息。

进程等待是如何进行的？

我们思考一个问题：能不能直接用一个全局变量标识出子进程的对应退出信息，之后让父进程获取到这个退出信息。为什么非得一定要调用这个函数呢？

本质上还是因为进程之间具有独立性，当标识子进程的状态的时候，由于会修改值，因此会发生写时拷贝，那么父进程就无法读取到了。所以必须要调用这两个函数。

僵尸进程的代码和数据可以被释放了，但是至少会保留进程的PCB信息，这其中保存了进程退出时的退出结果信息。一个进程退出时，退出码和退出信号，会写入PCB结构里面，以便让其他进程读取。

因此，wait读取本质是读取子进程的task_struct结构。并且由于wait和waitpid是内核数据结构对象，是系统调用，所以可以从操作系统中拿到task_struct的退出结果。

1 关于wait

wait主要介绍如何进行进程等待的，以及wait如何使用

wait是一个系统调用接口，它主要是进行阻塞式的等待。（父进程被挂起，一直等待回收子进程的状态，当子进程被回收之后，父进程才会退出）需要包含

#include<sys/types.h>

函数原型：pid_t wait（int*status）；

返回值是pid_t 也就是说当等待成功的时候就会返回子进程的pid，但是如果等待失败的话，就会返回-1.

status之后在介绍waitpid的时候会着重介绍，先把他设置成NULL，表示对这个进程是如何死掉的不太介意。当我们需要了解这个进程死亡的原因的时候就会关注了。

上述无法观察到从僵尸状态被回收的具体的过程，因为一旦子进程变成了僵尸进程，就被父进程回收了，但是实际上确实是这样子的。

2 waitpid

waitpid和wait的作用是差不多的，他也是用来进行进程等待的。但是相比于wait，他可以等待指定的一个进程，并且等待的方式也不是必须阻塞等待。

waitpid的函数原型：

pid_t waitpid(pid_t pid, int *status, int options)

关于返回值：和之前的wait相同，返回特定进程的pid，如果失败就返回-1

关于第一个参数pid_t pid 如果你想等待任意一个进程，那么这个值就可以给-1；但是如果你想要等待一个特定的进程，你就需要传入该进程的pid了。

关于第二个参数：status该参数是一个输出型参数，由操作系统填充。
如果传递NULL，表示不关心子进程的退出状态信息。
否则，操作系统会根据该参数，将子进程的退出信息反馈给父进程。

关于进程状态，之前提到过有三种;

代码正常跑完，并且结果正确

代码正常跑完，但是结果不正确

代码还没跑完，程序就崩溃了（有可能是我们发送信号强制终止，也有可能是自己运行崩溃了，即使是这种情况也是被信号终止的）

对于前两种，一般是用退出码来标识的。只有次低八位才表示退出的一个状态。

对于第三种程序崩溃，一般是被信号所杀，用最低七个比特位来标识进程收到的信号。这种情况下不光光是内部的代码有问题，也有可能是外部直接杀死了进程。所以代码有没有跑完完全是个未知数，她的退出码也就毫无意义了。

这些就是基本的一些信号，之后会做介绍，但是我们最关注的是前32个。

演示一下如何使用这个参数

对于这种没有收到退出信号，正常跑完的程序，退出码才有意义。10号退出码表示了他错误的原因，通过查询是因为没有子进程。

这里测试了一个野指针。当收到了终止信号之后，说明程序不是正常跑完的，那么关注退出码就没意义我们就不去关注她的退出码了

由于她的返回机制是这样子设计的，因此我们专门定义了一个宏来实现上述的位移操作，使用这个宏就可以获取到对应的状态了。

①WIFEXITED（status）这个宏主要是为了指出子进程是否是正常退出的，如果是就返回一个非零值。

虽然这个用数字也可以标识，但是如果用数字的话，我们可能会忘记对应的含义，但是用宏的话，就一目了然了。

②WEXITSTATUS（status）当进程异常退出（没跑完就崩了），也就是WIFEXITED为0i，那我们就可以用这个宏来提取子进程的返回值。她的底层实现就是刚才那份代码里的位移操作。

关于第三个参数options，他默认是0，标识阻塞等待，他一般是在内核中阻塞，等待被唤醒；如果传入WNOHANG的话就是非阻塞等待。

关于HANG（夯住）这个的理解：夯住就是这个进程没有被CPU调度。要么是在阻塞队列中，要么是正在等待被调度。

WNOHANG其实是一个宏定义 #define WNOHANG 1；

他用来标识非阻塞等待的这样一个状态，被作为参数传递给waitpid接收。waitpid是用C语言写的一个OS自己提供的系统调用接口。非阻塞等待就是父进程不必一直等待子进程返回状态了，在这个期间父进程可以去执行一些其他的任务，采用一种轮巡检测的方案。如果检测到子进程还未退出，父进程就去干自己的事情；如果检测到已退出，就去把这个子进程回收了。

wait和waitpid可以让进程的退出具有一定的顺序性。一定是子进程先退出，父进程才能去回收他。

关于内核代码的实现

waitpid的执行逻辑应该是主要通过检测子进程的退出状态来查看task_struct中的子进程运行信息。

如果子进程的的状态是退出的，那么就会返回子进程的pid；

如果检测到还没退出，就会有相应的代码来看是阻塞等待还是非阻塞等待。如果是阻塞等待，就会挂起父进程。阻塞等待的本质就是进程阻塞在系统函数的内部。如果是非阻塞等待的话，就又有一个EPI寄存器来保存当前的位置，当满足对应的条件的时候，父进程就从寄存器中读取这个位置的数据，方便waitpid重新调用。

如果检测到了其他出错的原因的话，就直接返回-1。

waitpid(child_id, status, flag)
{
	if (status == 退出)
	{
		return child_pid;
	}
	else if (status == 没退出)
	{
		if (flag == 0)
		{
			挂起父进程
		}
		else if (flag == WNOHANG)
		{
			return 0;
		}
	}
	else
	{
		return -1;
	}
}

大概是这样的一个样子