5.进程控制-CSDN博客

本文链接：https://blog.csdn.net/qq_64208053/article/details/141675273

进程控制

fork函数

#include <unistd.h>
pid_t fork(void);
返回值：自进程中返回0，父进程返回子进程id，出错返回-1

在这里插入图片描述

一般面试题：fork创建子进程，操作系统做了什么？

进程调用fork，当控制转移到内核中的fork代码后，内核做：

分配新的内存块和内核数据结构给子进程

将父进程部分数据结构内容拷贝至子进程

添加子进程到系统进程列表当中

fork返回，开始调度器调度，fork之后哪个进程先执行由调度器决定
fork调用失败的原因：系统中有太多的进程、实际用户的进程数超过了限制

我们知道，进程=内核数据结构+进程代码和数据
代码和数据哪里来？从磁盘中来，也就是你C/C++程序加载之后的结果。

创建子进程，操作系统给子进程分配对应的内核结构，这个结构式子进程自己独有的，因为进程具有独立性。
理论上，子进程也要有自己的代码和数据，但是一般而言，我们调用fork时，没有加载的过程啊，也就是说子进程没有自己的代码和数据，所以子进程只能“使用”父进程的代码和数据！
代码都是不可被写的，只能读取，父子进程共享代码，这没问题，
但数据呢，子进程的数据可能被修改，而父进程的数据可能不会被修改，所以，两个进程的数据，必须分离

通过什么方式分离父子进程的数据？上一篇我们讲过，就是写实拷贝

写实拷贝

写实拷贝的原理图在linux系统进程已经讲过了，这里就不画了
对于数据而言，创建进程的时候难道不直接拷贝父进程的数据然后分离吗？
答：如果创建进程的时候就直接拷贝分离，那么拷贝的时候，子进程可能会拷贝了根本不需要的数据，即便用到了，也可能是只读的，这样也太浪费空间了。编译器编译程序的时候尚且知道节省空间

创建进程的时候，能不能将不需要、不会被访问、只读取的数据不拷贝？怎么提前知道哪些数据值得拷贝？
答：无法知道，即便是OS也无法提前知道哪些数据需要被写入更新，即便提前拷贝了，你立马会使用吗

什么样的数据值得拷贝？
答：将来会被父进程或子进程写入的数据

所以OS选择写实拷贝技术，来将父子进程的数据进行分离

用的时候，再给你分配，是高效使用内存的一种表现

通常，父子代码共享，父子再不写入时，数据也是共享的，当任意一方试图写入，便以写时拷贝的方式各自一份副本

当调用 fork() 函数创建子进程时，操作系统并不立即复制父进程的内存空间给子进程，而是采用写时复制的策略。这意味着父子进程会共享相同的物理内存，直到其中一个进程尝试修改内存中的内容时，才会触发复制操作，确保父子进程之间的独立性。

写实拷贝是父子进程保持独立性的关键策略，因为它避免了不必要的内存复制，提高了程序的运行效率，并确保了父子进程之间的数据隔离。这种延迟复制的方式，在大多数情况下，减少了额外的内存开销，使得父子进程能够共享相同的内存空间，同时又能保持各自的独立性。

EIP寄存器的作用

我们的代码汇编后，会有很多行代码，并且每行汇编代码加载到内存之后都有对应的地址

进程可能随时被终端，下次回来，必须从上一次中断的位置开始，这就要求cpu必须随时记录下当前进程中断之前执行的位置

所以，cpu内就有对应的寄存器数据，用来记录当前进程的执行位置，这个寄存器叫eip

eip寄存器在cpu内只有1份，这些寄存器数据就叫进程的上下文数据

进程终止

进程终止时，OS做了什么？
当然是释放进程申请相关的内核数据结构和对应的数据和代码，本质就是释放系统资源

进程终止的常见方式

a.代码跑完，结果正确
b.代码跑完，结果不正确
c.代码没跑完，程序崩溃了（信号部分内容，涉及到1点点）
a和b类情况，代码会跑完，main函数都会有1个返回值，就是return 0

return 0的含义是什么，为总是0
返回0代表成功，返回非0，表示运行结果不正确
这就是进程的退出码，根据退出码的不同可以定位错误的原因

可以通过echo $?命令来获取最近一个进程执行完毕的退出码
在main函数内，return语句就是终止进程的

_exit函数

#include <unistd.h>
void _exit(int status);
参数：status 定义了进程的终止状态，父进程通过wait来获取该值

说明：虽然status是int，但是仅有低8位可以被父进程所用。所以_exit(-1)时，在终端执行$?发现返回值是255

exit函数

#include <unistd.h>
void exit(int status);

#include<stdlib.h>
int main()
{
	exit(111);//正常进场终止,111是作者自己赋予的退出码
}

exit最后也会调用_exit, 但在调用exit之前，还做了其他工作：

执行用户通过 atexit或on_exit定义的清理函数。
关闭所有打开的流，所有的缓存数据均被写入
调用_exit

在这里插入图片描述

库函数vs系统接口

在这里插入图片描述
我们使用printf的时候，数据保存在一个“缓冲区”内，请问这个“缓冲区”在哪里，属于用户空间还是内核空间？谁维护这个缓冲区？

答案是在用户空间，C标准库给我们维护的

如果是操作系统维护的缓冲区，_exit也能刷新出来

int main()
{
printf("hello");
exit(0);
}
运行结果:
[root@localhost linux]# ./a.out
hello[root@localhost linux]#

int main()
{
printf("hello");
_exit(0);
}
运行结果:
[root@localhost linux]# ./a.out
[root@localhost linux]#

进程等待

进程等待的必要性

之前讲过，子进程退出，父进程如果不管不顾，就可能造成‘僵尸进程’的问题，进而造成内存泄漏。

另外，进程一旦变成僵尸状态，那就刀枪不入，“杀人不眨眼”的kill -9 也无能为力，因为谁也没有办法杀死一个已经死去的进程。

最后，父进程派给子进程的任务完成的如何，我们需要知道。如，子进程运行完成，结果对还是不对，或者是否正常退出。

父进程通过进程等待的方式，回收子进程资源，获取子进程退出信息

wait函数

#include<sys/types.h>
#include<sys/wait.h>
pid_t wait(int*status);
/*返回值：
 成功返回被等待进程pid，失败返回-1。
参数：
 输出型参数，获取子进程退出状态,不关心则可以设置成为NULL*/

#include<stdio.h>
#include<unistd.h>
#include<stdlib.h>
#include<string.h>
int main()
{
        pid_t id=fork();
        if(id<0)
        {
			   perror("创建子进程失败");
                exit(1);//自定义退出码为1,标识进程运行完毕，结果不正确
        }
        else if(id == 0)
        {
                //子进程
                int cnt = 5;
                while(cnt)
                {
                        printf("cnt: %d,我是子进程,pid:%d,ppid:%d\n",cnt,getpid(),getppid());
                        sleep(1);
                        cnt--;
                }
                exit(0);//终止了子进程
        }
        else
        {
                printf("我是父进程，pid:%d,ppid:%d\n",getpid(),getppid());
                pid_t ret=wait(NULL);//等待子进程,阻塞式等待,子进程没走完，父进程会一直呆在这行代码，下面代码不会被执行
                if(ret>0)
                {
                        printf("等待子进程成功,ret%d\n",ret);
                }
                /*while(1)
                {
                        printf("我是父进程,pid:%d,%ppid:%d\n",getpid(),getppid());
                        sleep(1);
                }*/
        }
}

waitpid()函数

pid_ t waitpid(pid_t pid, int *status, int options);
//返回值：
 当正常返回的时候waitpid返回收集到的子进程的进程ID；
 如果设置了选项WNOHANG,而调用中waitpid发现没有已退出的子进程可收集,则返回0；
 如果调用中出错,则返回-1,这时errno会被设置成相应的值以指示错误所在；
//参数
 //pid：
 Pid=-1,等待任一个子进程。与wait等效。
 Pid>0.等待其进程ID与pid相等的子进程。
 //status（输出型参数）:
 WIFEXITED(status): 若为正常终止子进程返回的状态，则为真。（查看进程是否是正常退出）
 WEXITSTATUS(status): 若WIFEXITED非零，提取子进程退出码。（查看进程的退出码）
// options:
 0:表示阻塞等待
 WNOHANG: 非阻塞等待。若pid指定的子进程没有结束，则waitpid()函数返回0，不予以等待。若正常结束，则返回该子进程的ID。

如果子进程已经退出，调用wait/waitpid时，wait/waitpid会立即返回，并且释放资源，获得子进程退出信息。

如果在任意时刻调用wait/waitpid，子进程存在且正常运行，则进程可能阻塞。

如果不存在该子进程，则立即出错返回。

子进程完成后，父进程调用wait或者waitpid来防止或结束子进程的僵尸状态，并且可以获取到子进程的退出结果，包括信号编号和退出码

#include<stdio.h>
#include<unistd.h>
#include<stdlib.h>
#include<string.h>
int main()
{
        pid_t id=fork();
        if(id<0)
        {
			   perror("创建子进程失败");
                exit(1);//自定义退出码为1,标识进程运行完毕，结果不正确
        }
        else if(id == 0)
        {
                //子进程
                int cnt = 5;
                while(cnt)
                {
                        printf("cnt: %d,我是子进程,pid:%d,ppid:%d\n",cnt,getpid(),getppid());
                        sleep(1);
                        cnt--;
                }
                exit(105);//终止了子进程,并返回退出码105供status接收
        }
        else
        {
                printf("我是父进程，pid:%d,ppid:%d\n",getpid(),getppid());
            	int status=0;
                pid_t ret=waitpid(id,&status,0);//第三个参数设置为0，表示阻塞等待
                if(ret>0)
                {
                        printf("等待子进程成功,ret%d,status:%d\n",ret,(status>>8)&0xFF);//status次低八位才是子进程exit返回的退出码，所以status需要右移8位
                }
        }
}

status参数的理解

wait和waitpid，都有一个status参数，该参数是一个输出型参数，由操作系统填充。
如果传递NULL，表示不关心子进程的退出状态信息。
否则，操作系统会根据该参数，将子进程的退出信息反馈给父进程。
status不能简单的当作整形来看待，可以当作位图来看待，具体细节如下图（只研究status低16比特位）

在这里插入图片描述

status低7位是信号码

//打印信号编号
printf("等待子进程成功,ret%d,子进程收到的信号编号%d,status:%d\n",ret,(status&0x7F)，(status>>8)&0xFF);
//0x7F转换成二进制是0111 1111,与上这7位1，目的是保留低7位的值，其余位全部变为0

进程异常退出，或者崩溃，本质是OS杀掉了你的进程
OS如何杀掉进程？本质是通过发送信号方式（在信号文章讲）

程序异常，不光是内部代码有问题，也可能是外力直接杀掉(这时候子进程代码跑完了吗？不确定)

进程退出码也是子进程的数据，为什么父进程就能拿到？

我们接下来讨论一下以下情况
1.父进程通过wait/waitpid可以拿到子进程的退出结果，一定要用wait/waitpid函数吗？直接使用全局变量行不行？
答：不可以，进程具有独立性，数据修改就要发生写实拷贝，则父进程无法拿到子进程的退出结果

2.既然进程具有独立性，进程退出码不也是子进程的数据吗？父进程凭什么拿到？wait/waitpid究竟干了什么？

回答这个问题之前，先有一个理解：僵尸进程至少保留该进程的PCB信息，进程结构体里保留了进程退出时的退出结果信息，所以子进程退出时，它的结构体会保留退出信息

现在来说为什么在进程具有独立性的情况下，父进程能拿到子进程的退出码。
父进程调用wait/waitpid，本质是通过这个函数读取子进程task_struct结构体里的int exit_code, exit_signal成员变量。
wait/waitpid有这个权利读取子进程结构体里的成员变量吗？
有的，wait就是系统调用接口，就是操作系统来读取（进入内核态来读取）

也可以通过宏来获取指定进程的退出码和信号

status:
WIFEXITED(status): 若为正常终止子进程返回的状态，则为真。（查看进程是否是正常退出）
WEXITSTATUS(status): 若WIFEXITED非零，提取子进程退出码。（查看进程的退出码）

if(WIFEXITED(status))
{
	//为真，子进程是正常退出的	
	//提取退出码
	printf("子进程执行完毕，退出码位：%d\n"，WEXITSTATUS(status));
}else{
	//不为真，子进程异常退出
	printf("子进程异常退出，退出码位：%d\n"，WEXITSTATUS(status));
}

阻塞等待，本质是把进程阻塞在wait/waitpid系统函数的内部

waitpid的第3个参数设置为0，就是阻塞等待；设置为WHOHANG，就是非阻塞等待。
WHOHANG其实是 wait no hang（夯住了，不要挂着等待）。
设置了WHOHANG后，父进程先设置waitpid等待子进程，如果检查到子进程的退出状态，发现子进程没有退出，父进程调用的waitpid会立马返回。
让我们来看看waitpid的部分源码是怎么实现让进程阻塞和非阻塞等待的
在这里插入图片描述

在waitpid函数内部（在内核）

如果status==退出（子进程推出了），则返回子进程ID给父进程；

如果status==没退出（子进程还在运行，没有退出），

且如果flag标志位为0（阻塞式等待），则把父进程PCB放进等待队列中，（所以阻塞本质，是把进程阻塞在系统调用函数的内部）

如果flag标志位为WHOHANG（非阻塞等待），则函数内部给父进程立马返回0，不把父进程放进等待队列

当条件满足时，父进程被唤醒，从哪里唤醒，从if(flag==0)这里唤醒，因为有EIP寄存器保存着下一行代码的地址，唤醒后waitpid函数立马返回

进程的程序替换

替换原理

用fork创建子进程后执行的是和父进程相同的程序(但有可能执行不同的代码分支),子进程往往要调用一种exec函数以执行另一个程序。当进程调用一种exec函数时,该进程的用户空间代码和数据完全被新程序替换,从新程序的启动例程开始执行。调用exec并不创建新进程,所以调用exec前后该进程的id并未改变

在这里插入图片描述
进程替换，没有创建新的子进程。
如何理解所谓的讲程序放入内存？
就是程序加载到内存中，而exec*系列函数，本质就是如何加载程序的函数。

程序替换函数，只是替换了进程地址空间的数据和代码，并和当前进程的页表建立新的映射，其它不发生变化

替换函数

execl函数

后面的…是指字符一个一个传入的意思

int execl( const char*path,const char*arg,...);//三个点是可变参数列表，即可以传入多个不定参数

execl参数中，第一个参数是路径+文件名，第二个到倒数第2个参数，是可以传入的多个不定参数，最后1个参数必须填nullptr

#include<stdio.h>
#include<stdlib.h>
#include<unistd.h>
#include<sys/wait.h>
int main()
{
	printf("当前进程开始的代码！\n");
    execl("/usr/bin/ls","ls","-l","-a",NULL);//最后一个参数必须是NULL
    printf("当前进程的结束代码!\n");
}

执行execl函数成功后，printf(“当前进程的结束代码!\n”)这行代码就不会执行，因为程序替换会将已经执行和未执行的代码都替换了

所以一旦execl调用成功，原程序后续所有代码都不会再执行。
execl需要返回值吗？
不需要，execl不需要进行函数返回判定有没有替换成功

下面是更加系统的解释：
execl() 函数是一个执行新程序的系统调用，它会替换当前进程的映像为指定程序的映像，并开始执行新程序。在成功执行 execl() 函数后，当前进程的代码、数据和堆栈都会被新程序所取代，因此 execl() 函数本身并不返回到调用它的地方。

如果 execl() 函数成功执行，那么原来的进程映像已经被替换为新程序，并且新程序开始执行。因此，从 execl() 函数返回是不可能的，因为执行成功后进程就已经变成了新程序，原进程已经不存在。因此，即使 execl() 函数在执行成功后确实会返回，但这个返回值对调用者没有任何意义。

如果 execl() 函数返回到调用者，这通常表示执行失败。execl() 函数只有在发生错误时才会返回，返回值为 -1，并且设置全局变量 errno 表示错误的类型。因此，一般来说，如果 execl() 函数返回到调用者，这意味着它执行失败，调用者需要根据返回值进行错误处理。

Makefile规则

在 Makefile 文件中，gcc -o $@ $^ 是一行规则（rule），用于指示 make 工具如何生成目标文件。在这行代码中，$@ 和 $^ 是自动化变量，它们在 make 运行时会被替换为相应的数值。

$@：表示规则中的目标文件名。
$^：表示规则中的所有依赖文件名（即所有必须用来生成目标文件的文件）。

因此，gcc -o $@ $^ 的含义是使用 gcc 编译器将所有依赖文件（$^）链接在一起生成目标文件（$@）。

app: main.o func1.o func2.o
    gcc -o $@ $^

在这个例子中，app 是目标文件，main.o、func1.o、func2.o 是依赖文件。当运行 make app 命令时，make 工具会根据上述规则使用 gcc 编译器将 main.o、func1.o 和 func2.o 链接在一起生成 app 可执行文件。

一次形成多个可执行程序

在这里插入图片描述