进程 PCB
1. 进程
进程是程序运行后所产生的,是操作系统分配资源的基本单位,也是分配资源的最小单位,每个进程都有自己独立的地址空间和运行状态;将进程看作一个链表,操作系统管理进程的话,只要抓住链表的头就可以。
操作系统里面用一个结构体来管理进程得多个信息:PCB
程序= 代码段+数据段
进程=代码段+数据段+堆栈+PCB
查看进程ps -ef
内核中断技术(上下文切换)
先运行A进程,当需要运行B进程时,将A进程得环境信息存放到内存之中,开始运行B进程,当需要再次运行A进程得时候,将B进程的环境信息存放倒内存之中,再从内存之中将A进程的环境信息恢复出来。
2. 进程task_struct- PCB
- 进程的内部信息:在Linux中描述进程的结构体叫做task_struct,是Linux内核的一种数据结构包含着进程的信息,它会被装载到RAM(内存)。
task_struct 中管理的信息:
struct task_struct {
//进程编号
//进程状态
//打开文件的相关信息
//内存
进程之间的通信信息
struct task_struct *next;
struct task_struct *prev;
};
task_struct中的mm成员 ,所对应的struct mm_struct管理内存的
mmap指向虚拟的内存空间,它是个链表,每个节点代表的是链表中的一个段, 如(有的节点代表数据段,有的节点代表代码段,有的节点代表映射段)每一段又拥有起始地址和结束地址
操作系统的内核的话:是想访问那个空间就访问那个空间;用户的代码是不能够这样做的。
- 局部性:在有限的物理内存中跑更多的进程(把当前运行的代码放到内存之中,当前尚未运行的代码放到交换分区当中,下一次需要运行的时候再从交换分区拉出来)
虚拟内存和对应的物理内存之间的模块 页表
- 虚拟内存之中连续的页表,到物理内存之中就不一定连续
- 如果需要访问的数据不在物理内存之中,则会出现缺页中断,需要将虚拟地址中的数据拉到物理内存之中
- 把一个不使用的页换出去的策略,FIFO,先进先出(最远最久没有被使用的,可能很久不用,就提前出去)
页表的好处: - 解决了狼多肉少的问题 (很多的进程,只把有用的放进物理内存)
- 进程与进程的隔离(fork再次创建出的进程,虚拟地址相同但所对应的物理内存是不同的),进程与操作系统的隔离
- 加载的代码更少,运行的更快
- 根据需求,可以让两个进程共享同一个物理内存(进程交互,使得其两个进程映射的物理内存相同)
查看环境变量env
自己定义环境变量export +自己定义的环境变量
系统预定义环境变量PATH
- 进程和程序的区别是什么?
- 进程是程序的一次动态执行过程
- 程序是静态的,进程是动态的
- 进程的生命周期相对短暂,程序相对永久
- 进程有PCB
- 一个程序可以对应多个进程,一个进程只能对应一个程序
- 进程的状态变迁
Linux中的7态
进程组:其中ls
和wc-l
是一个组,ls
是组长(终端就是一个会话session,进程组在一个会话之中,会话中有很多的进程组)
3.进程创建和回收
0号进程,负责创建1号和2号进程,负责交换内存和swap
环境变量(名字通常大写):envp
for(i=0;i<envp[i]!=NULL;i++){
printf("%d : %s\n",i,envp[i]);
}
获取环境变量,给一个环境名,打印出环境变量`getnev()`
char* shell = getenv("SHELL"); //获取环境变量
printf("%s\n", shell == NULL ? "NULL" : shell);
设置环境变量:
if (putenv("AAA=abc") == 0) {
printf("putenv() ok\n");
}
else {
printf("putenv() error\n");
}
更改命令行参数时,需要将命令行参数和环境变量全部搬走
- 创建进程的一般过程:
分配一个唯一的标识符,在内核中创建出task_struct,复制父进程的环境信息,给新进程分配资源,栈,堆等等,拷贝父进程的地址空间内容,将新进程放入就绪队列
父进程返回的值是子进程的id,而子进程则返回的是0,如果返回-1,表示出错。
fork的注意点:
- 父子进程交替运行(抢占运行,需要谁调谁)
- 如果父进程还活着,子进程死了,此时子进程是僵尸状态
- 如果父进程死了,子进程就是孤儿进程,由孤儿院1接管
关于写时拷贝:
其中在创建出子进程后,代码段是不需要再次进行拷贝的,可以共享同一个物理内存,而数据段如果我们只是想要看的话不需要拷贝,一份就够了,如果想要更改这个数据,则需要重新拷贝一份。
例:一个父进程,创建出两个子进程
- 刷新缓存区和exit结束
带有换行符的在结束时已自动刷新缓存,而没有换行符的则等待函数结束后刷新
exit 结束符
exit(0) 0-255 只有16位是保存退出码的
- 收取僵尸和父进程回僵尸子进程
收取僵尸:wait(NULL) 查看返回值
父进程进入僵尸子进程:是抛出异常解决异常的过程
小技巧:
readelf -h
查看头信息
其中text是代码段,data是初始化的数据段,bss未初始化的数据段- 栈空间的大小只有8M
- 如何将进程从磁盘拉到物理内存之中
从磁盘之中先拿出来后,之后将其放到虚拟地址空间之中,依据所对应的页表,放入到物理内存之中;如果切换时,将其放入交换区,将新的进程开始运行,再次使用时,从交换区再取出来。 - 亲缘性(最优化)
服务器都是专用的,不会存在中途切出去后被别的进程打断,数据被清楚掉的情况存在。 - 错误信息
setjmp
和longjmp
反馈错误信息,谁需要谁再在进行修改。
dowhile(0)的用法:
- 进程组
- exec
exec是将磁盘中的代码直接拉到进程之中,将进程之中的代码进行替换,覆盖;但进程的编号不会发生改变,不能够恢复(把之前进程空间全部用新的代码所代替,但再次启动时还是原本的运行代码)int execlp(const char* file, const char *arg)
,其中file时可执行程序的名字,arg为NULL