进程创建
fork深挖
对于返回值:为何要给子进程返回0,给父进程返回子进程的pid?
父进程:子进程为1:n的关系,父进程创建子进程通常是要执行任务的,这时候,存在多个子进程执行不同的任务,父进程就需要区分不同的子进程
所以就会通过返回子进程pid的方式返回给父进程
对于forkOS做了:
分配新的内存块和内核数据结构给子进程
将父进程部分数据结构内容拷贝至子进程
添加子进程到系统进程列表当中
fork返回,开始调度器调度
所以在fork内部,就已经出现了两个执行流,这样才会返回两个返回值
fork之后谁先运行谁后运行时不确定的,有调度器决定
写时拷贝
父子代码共享,父子在不写入时,数据也是共享的
共享:父子进程地址空间页表映射时指向同一物理内存空间
为什么要写时拷贝:进程具有独立性
为什么不在创建子进程的时候就为其数据开辟空间?
1.子进程不一定会使用父进程的所有数据
2.这样实现了:①按需分配②延时分配
优点:可以高效地使用任何的内存空间
fork调用失败的原因 :
①系统中有太多的进程
②实际用户的进程数超过了限制
进程终止
进程退出场景:
① 代码运行完毕
②结果正确代码运行完毕
③ 结果不正确代码异常终止(OS向进程发送信号)
OS除了区分每个进程外,还需要知道进程完成所分配的任务的状况
所以在main函数就需要返回一个值给OS:0表示结果正确,!0表示错误的各种原因
在linux中用echo $?显示最近的一次进程的返回值
正常终止
- 从main返回
- 调用exit
- _exit
所以二者差别:
exit会释放进程曾经占用的资源
_exit不会做任何收尾工作
异常退出:
比如ctrl + c,通过OS发送信号终止进程
进程异常退出,退出码没有任何意义
进程终止:先将进程从各种队列中移除,释放申请的数据结构,清除对应页表,释放申请的内存
进程等待
进程等待一般都是父进程
为什么要有进程等待
当子进程退出时,无人读取它的退出信息就会成为僵尸进程,造成内存泄漏
僵尸进程刀枪不入,kiil -9也不能将它杀死
此外,父进程派给子进程的任务完成的如何,父进程需要得到反馈
所以进程等待的目的:回收子进程资源,获取子进程的退出信息
①wait
#include<sys/types.h>
#include<sys/wait.h>
pid_t wait(int*status);
返回值: 成功返回被等待进程pid,失败返回-1
参数: 输出型参数,获取子进程退出状态,不关心则可以设置成为NULL
wait获取到子进程的信息后,并没有出现僵尸状态,直接被回收
父进程在阻塞等待子进程的退出
wait只能等待一个进程
②waitpid
waitpid是等待指定的某一进程
pid_ t waitpid(pid_t pid, int *status, int options);
返回值: 当正常返回的时候waitpid返回收集到的子进程的进程ID;
如果设置了选项WNOHANG,而调用中waitpid发现没有已退出的子进程可收集,则返回0;
如果调用中出错,则返回-1,这时errno会被设置成相应的值以指示错误所在;
参数:
pid: pid=-1,等待任一个子进程。与wait等效
pid>0:等待其进程ID与pid相等的子进程。
status:
WIFEXITED(status): 若为正常终止子进程返回的状态,则为真。(查看进程是否是正常退出)
WEXITSTATUS(status): 若WIFEXITED非零,提取子进程退出码。(查看进程的退出码)
options:
WNOHANG: 若pid指定的子进程没有结束,则waitpid()函数返回0,不予以等待。若正常结束,则返回该子进程的ID。
进程等待成功只能意味着子进程的退出,并不能说明子进程的正常运行
③status
低16位比特位:
次低八位代表进程的退出码,低7位代表进程退出的信号以及核心转储 core dump
位操作获取退出码以及信号 :
用宏获取
上面父进程是阻塞等待,下面通过控制waitpid的第三个参数实现父进程的非阻塞等待
进程程序替换
exec系列替换函数
#include <unistd.h>
int execl(const char *path, const char *arg, …);
int execlp(const char *file, const char *arg, …);
int execle(const char *path, const char *arg, …,char *const envp[]);
int execv(const char *path, char *const argv[]);
int execvp(const char *file, char *const argv[]);
int execve(const char *path, char *const argv[], char *const envp[]);
执行谁
path:可执行程序的路径
怎么执行
args+…
…:可变参数列表,以NULL结尾
该过程并没有创建新的进程,只是进行了程序的替换,原来的PCB,mm_struct(物理内存左边的部分)并没有改变,所以不存在新进程
如果替换成功,函数后面的代码已经被替换,所以不会被执行,替换失败就不会受到影响
示例:
父子进程拥有独立的进程地址空间,并且进程之间具有独立性,所以子进程发生替换并不会影响父进程
六个函数的区别:
l(list) : 表示参数采用列表
v(vector) : 参数用数组
p(path) : 有p自动搜索环境变量PATH
e(env) : 表示自己维护环境变量
test.c替换了proc.c的子进程的代码,并且该子进程传递了环境变量myenv给test.c
简易shell的实现