进程描述符及任务结构
内核把进程的列表存放在任务队列的双向循环链表中,链表中的每一项都是类型为task_struct,称之为进程描述符或者叫做进程控制块的结构,该结构包含着一个具体进程的全部信息。
task_struct在32位操作系统上大小约为1.7KB,看着挺大,但是要考虑到该结构体内包含着一个进程的所有信息,那么也就挺小的了。task_struct包含的信息包括:打开的文件,进程的地址空间,挂起的信号,进程的状态,等等。
通过slab分配器动态分配task_struct,所以只需要在内核栈底开辟一个新的结构struct thread_info,这个thread_info结构体内会存在一个指向task_struct的指针。
进程创建
首先调用fork()通过拷贝当前进程创建一个子进程,然后再调用exec()函数负责读取可执行文件并将其加载到地址空间上进行运行。传统的fork()系统调用是直接把所有的资源复制给新的进程,这种方式是简单但是效率很低,因为要复制的数据可能并不共享。更极端的是,如果创造出来的新进程立刻就需要执行一个新的映像,那么之前的拷贝一点意义也不存在。所以Linux的fork()系统调用使用了写时拷贝技术,写时拷贝技术顾名思义,就以一种写入时才进行拷贝的技术,从而再让父子进程拥有各自的拷贝,也就是说资源的拷贝是在进行写入的时候才进行,在此之前,只是以只读的方式进行共享。
这种技术的实现使得地址空间上的页的拷贝推迟到了写入的时候,在页根本就不会被写入的情况下,就不会重复拷贝了。(比如:fork()之后立即调用exec(),这种优化可以避免拷贝大量根本就不会被使用的数据)
那么fork()的实际开销就是复制父进程的页表,以及给子进程创建唯一的进程描述符pcb。
系统调用fork(),