Linux----进程控制(上)
1)进程创建
fork()
在 Linux----进程概念(下)中讲到了fork(),这里详讲
作用:
此函数创建一个新进程。 返回值是子进程中的零,父进程中子进程的进程 ID 号,或者错误时为 -1。 在-1情况下,ERRNO 指示问题。 在子进程中,PROCINFO[“pid”] 和 PROCINFO[“ppid”] 被更新以反映正确的值
进程调用fork,当控制转移到内核中的fork代码后,内核:
- 分配新的内存块和内核数据结构给子进程
- 将父进程
部分
数据结构内容拷贝至子进程- 添加子进程到系统进程列表当中
- fork返回,开始调度器调度
所以,fork之前父进程独立执行,fork之后,父子两个执行流分别执行。注意,fork之后,谁先执行完全由调度器决定(没有顺序规定)
创建子进程,本质是系统多了一个进程,多了一套以父进程为模的板进程相关的数据结构
,在不写入
的情况下,用户的代码和数据是父子共享的
① fork()返回值为什么有两个(返回两次)?
通常,父子代码共享,父子再不写入时,数据也是共享的,
当任意一方试图写入,便以写时拷贝的方式各自一份副本
(写时拷贝的过程实现,OS参与完成)
一般是这样:
pid_t pid = fork();
- pid是一个变量,返回的时候,本质是把返回值写入到变量,写入的时候就是写时拷贝
- 父子页表映射数据到了不同的内存区域
写时拷贝
:保证父子进程的独立性
为什么要写时拷贝?
- 所有的数据,不是父和子都会写入,不需要写入修改的数据
(只读)
,拷贝是没有意义的浪费内存和系统资源- fork时,创建数据结构,如果还要将数据拷贝一份,fork效率的降低
- fork本身就是向系统要更多的资源,要更多的资源更容易导致fork失败
注意:
代码段也会发生类似写时拷贝的问题
② fork()常见使用场景
场景:
- 一个父进程希望复制自己,使父子进程同时执行不同的代码段。例如,父进程等待客户端请求,生成子进程来处理请求。
- 一个进程要执行一个不同的程序。例如子进程从fork返回后,调用exec函数
③ fork()调用失败的原因
原因:
- 系统中有太多的进程
- 实际用户的进程数超过了限制
2)进程终止
main函数里的
return 0;
是什么?
return代表进程推出, 0是进程的退出码表示成功
进程退出的情况分类
- 代码运行完毕,结果正确,退出码为0
- 代码运行完毕,结果不正确,退出码!0
- 代码异常终止,退出码无意义
(野指针,\0,越界...)
使用
echo $?
查看最近一次执行的程序的退出码
在C中提供了错误码list,如下代码可以查看,使用了函数strerror()查看二进制对应的错误信息int main() { for(int i=0;i<100;i++){ printf("%d: %s\n",i,strerror(i));//C提供的错误码列表 } return 0; }
进程退出方法
①exit()
#include <unistd.h>
void exit(int status);
status 定义了进程的终止状态,父进程通过wait来获取该值
return和exit的区别:
- 非main函数的return不是终止程序,而是结束函数
- exit无论在哪里,都是直接终止程序
exit()会做:
- 执行用户通过 atexit或on_exit定义的清理函数。
- 关闭所有打开的流,所有的缓存数据均被写入
- 调用_exit
②_exit()
#include <unistd.h>
void _exit(int status);
exit和_exit区别:
- exit:在退出的的时候,会进行后续资源处理,包括刷新缓冲区
- _exit: 在退出的的时候,不会进行后续资源处理,直接终止进程
int main() { printf("hello world"); _exit(20); return 0; }
int main() { printf("hello world"); exit(20); return 0; }
在操作系统角度理解进程终止
核心思想:
- “释放”曾经为了管理进程所维护的所有数据结构对象
- 释放程序代码和数据占用的内存空间
- 取消曾经该进程的链接关系
这里的
释放
,不是真的把数据结构对象销毁,而是设置为不用状态
,然后保存起来,如果不用的对象多了,就有一个"数据结构池
"
同样,释放程序代码和数据占用的内存空间 不是代码和数据清空,而是把内存设置为无效
"数据结构池"提高了效率,因为每次申请空间都会耗时,初始化强转