大家好我是沐曦希💕
一、fork()函数
从已存在进程中创建一个新进程。新进程为子进程,而原进程为父进程。
返回值:自进程中返回0,父进程返回子进程id,出错返回-1
- fork()函数两个返回值问题
fork()函数的实现在操作系统内部,函数准备return的时候核心代码已经执行完,子进程早已经被创建,并且可能在OS的运行队列中,准备被调度。
fork之后,有两个执行流,父子进程代码是共享的,所以return会被调度两次,被父子进程各自执行return的。
- 如何理解父进程返回子进程pid,子进程返回0
父亲只能有一个,孩子可以有多个,孩子找父亲具有唯一性
因为孩子可以有多个,就需要给父进程返回子进程pid,偏于父进程标识子进程
- 如何理解一个id值,怎么可能会保存两个不同值,让if,else同时执行
pid_t id = fork();返回本质就是写,所以谁先返回,谁就先写入id,因为进程具有独立性,要进行写时拷贝。
同一个id,地址是一样的,但是内容却不一样。
进行了写时拷贝
进程调用fork,当控制转移到内核中的fork代码后,内核做:
分配新的内存块和内核数据结构给子进程
将父进程部分数据结构内容拷贝至子进程
添加子进程到系统进程列表当中
fork返回,开始调度器调度
当一个进程调用fork之后,就有两个二进制代码相同的进程。而且它们都运行到相同的地方。但每个进程都将可以,开始它们自己的旅程。
- fork常规用法
1.一个父进程希望复制自己,使父子进程同时执行不同的代码段。
2.一个进程要执行一个不同的程序。
- fork调用失败原因:
1.系统中有太多的进程
2.实际用户的进程数超过了限制
可以用下面代码进行测试:
二、退出码
main函数的return 0 在系统上叫做进程退出时对应的退出码,标定进程执行的结果是否正确。
进程退出码,可用echo $?查询:
记录最近一次进程在命令行中执行完毕后的退出码
需要注意的是:echo $? 也是一个进程
那么如何设定main函数返回值呢?如果不关心进程的退出码,设置为0就行。如果要关心进程退出码的时候,要返回特定的数据表明特定的错误。
退出码的意义:0表示成功,成功只有一个;非零标识失败,不同的的值标识不同的错误。同时,退出码一般都有对应的退出码的文字描述,可以自定义也可以使用系统的映射关系。>比如之前学过的strerror。
三、进程退出
- 进程退出情况:
1.代码运行完且结果正确------return 0
2.代码运行完但结果不正确-----return !0(退出码这个时候起效果)
3.代码没有运行完,程序异常了,退出码无意义。
- 进程退出方法
1.main函数返回
2.任意地方调用exit(code);
3.调用_exit()
- exit()和_exit()区别
#include<stdio.h>
#include<unistd.h>
#include<stdlib.h>
int main()
{
printf("hello world");
sleep(1);
exit(12);
return 0;
}
#include<stdio.h>
#include<unistd.h>
#include<stdlib.h>
int main()
{
printf("hello world");
sleep(1);
_exit(12);
return 0;
}
同样的一段代码,exit()和_exit()的结果却是不同。对于exit():结果会打印出来,对于_exit():结果没有显示,这是因为缓冲区的缘故。
所以exit()终止进程,会主动刷新缓冲区,_exit()终止进程,不会刷新缓冲区。用户级的缓冲区(doge)对于缓冲区在哪的问题后面涉及到在细谈
四、进程等待
进程中有僵尸(Z)状态,造成原因:子进程退出了,父亲没有回收子进程的退出码,进而造成内存泄漏。另外,kill也无能为力,因为谁也没办法杀死不了一个已经死去的进程 ,最后,父进程派给子进程的任务完成的如何,我们需要知道, 如何去解决?通过进程等待的方式进行解决僵尸进程问题。
- 进程为什么要等待
1.父进程通过进程等待的方式,回收子进程资源
2.获取子进程退出信息
进程等待方法
1.wait方法
ps ajx | head -1 && ps axj | grep WProc | grep -v grep
while :;do ps ajx | head -1 && ps ajx | grep Wproc | greap -v greap; sleep 1; done
可以看到父进程在子进程运行完之后,对处于僵尸状态的子进程进行了回收。
waitpid方法
-
返回值:
当正常返回的时候waitpid返回收集到的子进程的进程ID;如果设置了选项WNOHANG,而调用中waitpid发现没有已退出的子进程可收集,则返回0;如果调用中出错,则返回-1,这时errno会被设置成相应的值以指示错误所在; -
参数:
pid:
Pid=-1,等待任一个子进程。与wait等效。
Pid>0.等待其进程ID与pid相等的子进程。
status:
WIFEXITED(status): 若为正常终止子进程返回的状态,则为真。(查看进程是否是正常退出)
WEXITSTATUS(status): 若WIFEXITED非零,提取子进程退出码。(查看进程的退出码)
options:
WNOHANG: 若pid指定的子进程没有结束,则waitpid()函数返回0,不予以等待。若正常结束,则返回该子进程的ID。
-
获取子进程status
wait和waitpid,都有一个status参数,该参数是一个输出型参数,由操作系统填充。
如果传递NULL,表示不关心子进程的退出状态信息。
否则,操作系统会根据该参数,将子进程的退出信息反馈给父进程。
status不能简单的当作整形来看待,可以当作位图来看待,具体细节如下图(只研究status低16比特位):
次低8位:退出状态((>>8)&0xFF)。低7位:终止信号(&0x7F)。若pid指定的子进程没有结束,则waitpid()函数返回0,不予以等待。若正常结束,则返回该子进程的ID
sig number用法:
对应的错误:
僵尸进程退出的时候对应信息放在哪:
子进程和父进程有对应的pcb信息,父进程调用waitpid,子进程退出的时候把对应的代码和信号保存起来,保存到PCB。而waitpid是系统调用,以操作系统身份执行代码,找到子进程,把传入的status传入子进程里面,把代码和退出信号设置进status,设置完毕之后把值输入status。也就是说,等待的本质是检测子进程退出信息,将子进程退出信息通过status拿回来。所以最终看到了status的结果
对于获得子进程的退出结果,我们可以不采用位操作进行,Linux提供了对应操作的宏
WIFEXITED(status): 若为正常终止子进程返回的状态,则为真。(查看进程是否是正常退出)
WEXITSTATUS(status): 若WIFEXITED非零,提取子进程退出码。(查看进程的退出码)
#include<stdio.h>
#include<unistd.h>
#include<stdlib.h>
#include<assert.h>
#include<sys/types.h>
#include<sys/wait.h>
int main()
{
pid_t id = fork();
assert(id != -1);
if(id == 0)
{
//子进程
int cnt = 5;
while(cnt)
{
printf("child running,pid:%d,ppid:%d,cnt:%d\n",getpid(),getppid(),cnt--);
sleep(1);
}
}
//parent
int status = 0;
int ret = waitpid(id,&status,0);
(void)ret;
if(id > 0)
{
//是否正常退出
if(WIFEXITED( status ))
{
printf("exit code:%d\n",WEXITSTATUS( status ));
}
else
{
//异常退出
printf("child exit not normal!\n");
}
}
return 0;
}
总结来说,子进程退出变成僵尸,会把自己的退出的结果写入自己的task_struct,wait/waitpid是一个系统调用,OS有能力去读取子进程的task_struct:第一步让OS释放子进程的僵尸状态,第二步获取子进程的退出结果。
五、进程阻塞与非阻塞
阻塞等待(0):父进程调用wait/waitpid等子进程时,等待子进程退出,这是阻塞时等待
非阻塞等待(WNOHANG):检测状态,如果没有就绪父进程检测之后立即返回。每一次非阻塞等待都是一次,多次非阻塞等待称为轮询的过程。
非阻塞不会占用父进程的精力,可以在轮询期间,让父进程干别的事情。
例如:
#include <stdio.h>
#include <unistd.h>
#include <string.h>
#include <sys/types.h>
#include <sys/wait.h>
#include <assert.h>
#include <stdlib.h>
#define NUM 10
typedef void (*func_t)();
func_t handlerTask[NUM];
void task1()
{
printf("handler task1\n");
}
void task2()
{
printf("handler task2\n");
}
void task3()
{
printf("handler task3\n");
}
void loadTask()
{
memset(handlerTask, 0, sizeof(handlerTask));
handlerTask[0] = task1;
handlerTask[1] = task2;
handlerTask[2] = task3;
}
int main()
{
pid_t id = fork();
assert(id != -1);
if (id == 0)
{
int cnt = 10;
while (cnt)
{
printf("这是子进程pid:%d,ppid:%d,cnt:%d\n", getpid(), getppid(), cnt--);
sleep(3);
}
exit(10);
}
loadTask();
int status = 0;
while (1)
{
pid_t ret = waitpid(id, &status, WNOHANG);
//WNOHANG:非阻塞:子进程没有退出,父进程检测之后立即退出
if (ret == 0)
{
//waitpid调用成功&&子进程没退出
//子进程没有退出,我的waitpid没有等待失败,仅仅检测到而来子进程没有退出
printf("wait done,but child is running...parent running other things\n");
for (int i = 0; handlerTask[i] != NULL; i++)
{
handlerTask[i]();//回调
}
}
else if (ret > 0)
{
//waitpid调用成功&&子进程退出
printf("wait success,exit code:%d,sig:%d\n", (status >> 8) & 0xFF, status & 0x7F);
break;
}
else
{
//waitpid调用失败
printf("waitpid call failed\n");
break;
}
sleep(1);
}
return 0;
}
六、进程替换
创建子进程的目的:
- 让子进程执行父进程代码的一部分——执行父进程对应的磁盘代码中的一部分
- 让子进程执行一个全新的程序——让子进程想办法加载到磁盘上指定的程序,执行新程序的代码和数据
替换函数:
#include <unistd.h>`
int execl(const char *path, const char *arg, ...);//...是可变参数列表
int execlp(const char *file, const char *arg, ...);
int execle(const char *path, const char *arg, ...,char *const envp[]);
int execv(const char *path, char *const argv[]);
int execvp(const char *file, char *const argv[]);
int execve(const char *path, char *const argv[], char *const envp[]);
对于替换函数,需要注意:execl系列函数结尾要以NULL结尾
功能大致是将指定的程序加载到内存中,让指定进程进行执行cmd中的选项。
- execl
- 为什么第二个printf和execl没有执行
替换原理
用fork创建子进程后执行的是和父进程相同的程序(但有可能执行不同的代码分支),子进程往往要调用一种exec函数以执行另一个程序。当进程调用一种exec函数时,该进程的用户空间代码和数据完全被新程序替换,从新程序的启动例程开始执行。调用exec并不创建新进程,所以调用exec前后该进程的id并未改变。
程序替换的本质就是将指定程序的代码和数据加载到指定的位置,覆盖自己的代码和数据。进程替换的时候并没有创建新的进程。
第二个printf和execl也是代码,在第一个execl执行完毕的时候,代码已经全部被覆盖了,开始执行新的程序的代码了,所以第二个printf和execl就无法执行了。
- 返回值
这些函数如果调用成功则加载新的程序从启动代码开始执行,不再返回,和接下去的代码无关了。如果调用出错则返回-1,所以exec函数只有出错的返回值而没有成功的返回值。
进程具有独立性,所以这里的替换并不会影响父进程。通过虚拟地址空间以及页表保证进程独立性,一旦执行流想替换代码或者数据就会发生写时拷贝。
注意:进程执行的时候,execl先执行,main后执行。execl系列函数将程序加载到内存中,所以Linux的execl接口是加载器,所以是先加载后执行,main也是函数也要被调用,通过execl/系统传参给main
同时,对于其他替换函数,如何记住用法:
l(list) : 表示参数采用列表,将参数一个一个的传入exec*
v(vector) : 参数用数组,将所有的执行参数,传入数组中,统一传递不用使用可变参数
p(path) : 有p自动搜索环境变量PATH,进行可执行程序的查找,不需要传程序的地址
e(env) : 表示自己维护环境变量
- execlp
#include<stdio.h>
#include<stdlib.h>
#include <unistd.h>
int main()
{
char *const argv[] = {"ps", "-ef", NULL};
char *const envp[] = {"PATH=/bin:/usr/bin", "TERM=console", NULL};
execl("/bin/ps", "ps", "-ef", NULL);
// 带p的,可以使用环境变量PATH,无需写全路径
execlp("ps", "ps", "-ef", NULL);
// 带e的,需要自己组装环境变量
execle("ps", "ps", "-ef", NULL, envp);
execv("/bin/ps", argv);
// 带p的,可以使用环境变量PATH,无需写全路径
execvp("ps", argv);
// 带e的,需要自己组装环境变量
execve("/bin/ps", argv, envp);
exit(0);
}
事实上,只有execve是真正的系统调用,其它五个函数最终都调用 execve,也就是说
程序替换中execve是系统调用,其他都是封装,目的是为了有更多的选择性,所以execve在man手册 第2节,其它函数在man手册第3节,它们之间的关系: