Process Management
进程
进程 VS 线程
进程:正在运行的项目,包括代码和相关资源
线程:进程里活动的对象。每一个线程仅有一个计数器、进程栈和进程寄存器
一般来说,一个进程有一个或多个线程。在Linux中,没有特别区分线程和进程,线程不过是一种特殊的进程。
进程两种虚拟化
虚拟进程:假设该进程独占系统
虚拟内存:假设该进程独占整个系统内存空间
线程共享虚拟内存,而每个进程都有自己的虚拟进程。
进程基本操作
- 父进程通过
fork()
创建子进程,在Linux中是通过clone()
实现。紧接着exec()
创建新的地址空间和加载新的项目。 - 父子程序在
fork()
返回的地方继续执行。fork()
从内核中返回两次,分别从父进程和子进程。 - 一个项目通过
exit()
退出,子进程退出后进入僵尸状态,直到父进程通过调用wait4()
找到僵尸进程,并结束释放其资源。
Processor Descriptor and Task Structure
内核存储一个双向循环链表叫task list,每个task list中的元素是一个process descriptor,是以task_struct这个数据结构存储的,包括了和该进程相关的所有信息。
分配process descriptor
每个进程都有一个进程内核栈,当一个process descriptor被slab allocator动态创建时,一个新的数据结构thread_info会被同时创建,存储在进程内核栈的栈顶(自底向上)或栈底(自顶向下)。thread_info中有一个指针会指向真正的task_struct。
存储process descriptor
系统会给每个进程分配一个独一无二的标识符PID,每个task_struct里都会有pid字段存储PID值。为了兼容之前的系统,PID最大值为32768。若系统想打破兼容性,可以在/proc/sys/kernel/pid_max中修改最大值。
通常会用宏current来表示当前正在执行的进程或用current_task_info() -> task
返回当前进程的task_struct。