一、进程的定义
进程是一个动态的概念,是Linux系统的基本调度单位。一个进程由如下元素组成:
- 进程读取的上下文,它表示进程读取的执行状态;
- 进程当前执行目录;
- 进程服务的文件和目录;
- 进程的访问权限;
- 内存和其他分配给进程的系统资源。
每个进程都有一个进程号,即PID,一个PID唯一的标识一个进程,一个进程创建新进程称为创建子进程,这个进程称为父进程。所有进程追溯到其祖先最终都会落到进程号为1的进程身上,这个进程叫init进程,是内核自启动后的第一个启动的进程,也是其他所有进程的父进程。如果某个父进程在它的子进程结束之前终止了,则失去了父进程的子进程就会以init进程作为父进程。通过ps -af命令可以列出父进程ID为1的进程,使用pstree命令可以查看系统正在运行的各个进程之间的继承关系。
二、进程的状态
- 就绪态:进程已经准备就绪,随时可以调度执行,但当前不占用CPU资源。
- 执行态:正在被CPU执行,占用了CPU资源。
- 可中断等待态:这种状态的进程都在等待某个事件或某个资源,系统不会对其进行调度,当系统产生一个中断或者释放了系统等待的资源,或者进程收到了一个信号,都可以唤醒此进程转换到就绪状态。
- 不可中断等待态:与可中断等待态类似,但不会因为接收到信号而唤醒。
- 僵死态:进程已经被中止但它的状态还没有被父进程获取。
- 暂停态:处于暂停状态的进程,一般都是由执行态转换而来,等待某种特殊处理,比如处于调试跟踪的程序,每执行到一个断点就转入暂停态,等待新的信号输入。
三、Linux进程的结构
Linux中一个进程在内存中有3部分数据,分为数据段、堆栈段、代码段。
- 代码段:用来存放程序代码,如果有多个程序运行相同的一个程序,那么可以使用同一个代码段;
- 数据段:用来存放程序的全局变量、常数以及动态数据分配的数据空间;
- 堆栈段:用来存放子程序的返回地址、子程序的参数以及程序的局部变量。还包括进程控制块PCB,PCB处于进程的核心堆栈的底部,不需要额外分配空间。
可以看我的另一篇博客:代码段(codesegment/textsegment)、数据段(datasegment)、bss段(bsssegment)、rodata段、栈(stack)、堆(heap)
四、进程的种类
- 交互进程:有一个shell启动的进程,既可以在前台运行,也可以在后台运行;
- 批处理进程:不与特定的终端相关联,提交到等待队列中顺序执行进程;
- 守护进程:在Linux启动时初始化,需要时运行于后台的一些服务进程
五、进程的创建
使用fork()函数创建进程,这个函数名是“分叉”的意思,具体使用格式如下
#include <sys/type.h> //提供类型pid_t的定义
#include <unistd.h> //提供函数的定义
pid_t fork(); //创建进程
调用fork()函数后,Linux系统会赋值一个与父进程完全相同的子进程,这两个进程共享代码空间,但数据空间是相互独立的,子进程的数据空间中的内容是父进程的完整复制,指令指针也完全相同。唯一不同的是子进程fork的返回值是0,父进程fork的返回值是子进程的进程号,如果fork不成功,父进程会返回错误。
六、 Linux进程控制块task_struct的结构描述
Linux在内核空间专门开辟了一个指针数组task,用来有效的管理所有进程控制块task_struct结构的指针。Task数组大小限制了系统并发执行的进程总数。task_struct结构包含如下信息:
- 进程当前的状态;
- 调度信息:进程的类别、调度策略、优先级等调度属性;
- 进程标识:进程标识号PID、组标识号GID、用户标识UID;
- 进程通信信息:Linux支持多种通信机制,也存储在其中;
- 进程的家族关系:有许多进程指针,分别指向祖先进程(初始化进程)、父进程、子进程及新、老进程的task_struct结构;
- 时间和定时信息:用于追踪和记录进程的整个生存期内使用CPU的时间;
- 文件系统信息:保存了进程和文件系统的相关信息;
- 存储管理信息:存储了进程虚拟存储空间信息及其与物理内存相关的信息;
- CPU现场保留信息:CPU寄存器、堆栈等环境
进程所有操作都依赖task_struct结构,task_struct结构是进程实体的核心,是进程存在的唯一标志。
参考ARM9嵌入式系统设计