Linux内核——进程管理(二)

进程上下文
可执行程序代码是进程的重要组成部分。这些代码从一个可执行文件载入到进程的地址空间执行。一般程序在用户空间执行。当一个程序执行系统调用或者触发了某个异常,它就陷入了内核空间。此时,我们称内核“代表进程执行”并处于进程上下文中。在此上下文中current宏是有效的。除非在此间隙有更高优先级的进程需要执行并由调度器做出了相应的调整,否则在内核退出的时候,程序恢复在用户空间会继续执行。
系统调用和异常处理程序是对内核明确定义的接口。进程只有通过这些接口才能陷入内核执行——对内核的所有访问都必须通过这些接口。

进程家族树
Unix系统的进程之间存在一个明显的继承关系,在Linux系统中也是如此。所有的进程都是PID为1的init进程的后代。内核在系统启动的最后阶段启动init进程。该进程读取系统的初始化脚本(initscript)并执行其他的相关程序,最终完成系统启动的整个过程。
系统中的每个进程必有一个父进程,相应的,每个进程也可以拥有零个或多个子进程。拥有同一个父进程的所有进程被称为兄弟。进程间的关系存放在进程描述符中。每个task_struct都包含一个指向父进程的task_struct,叫做parent的指针,还包含一个称谓children的子进程链表。所以,对于当前进程,可以通过下面的代码获得其父进程的进程描述符:

struct task_struct *my_parent=current->parent;

同样,也可以按以下方式访问子进程:

struct task_struct *task;
struct list_head *list;
list_for_each(list,&current->children) {
    task=list_entry(list,struct task_struct,sibling); /*task现在指向当前的某个子进程*/
}

init进程的进程描述符是作为init_task静态分配的。下面的代码可以很好地演示所有进程之间的关系:

struct task_struct *task;
for(task=current;task!=&init_tasl;task=task->parent)
    ;
/*task现在指向init*/

实际上,你可以通过这种继承体系从系统的热河一个进程出发查找到任意指定的其他进程。但大多数时候,只需要通过简单的重复方式就可以遍历系统中的所有进程。这非常容易做到,因为任务队列本来就是一个双向的循环链表。对于给定的进程,获取链表中的下一个进程:

list_entry(task->task.next,struct task_struct,tasks);

获取前一个进程的方法与之相同:

list_entry(task->task.prev,struct task_struct,tasks);

这两个例程分别通过next_task(task)宏和prev_task(task)宏来实现。而实际上,for_each_process(task)宏提供了又依次访问整个任务队列的能力。每次访问,任务指针都指向链表中的下个元素:

struct task_struct *task;
for_each_process(task) {
    /*它打印出每一个任务的名称和PID*/
    printf("%s[%d]\n",task->comm,task->pid);
}

进程的创建
Unix的进程创建很特别。许多其他的操作系统都提供了产生(spawn)进程的机制,首先在新的地址空间里创建进程,读入可执行文件,最后开始执行。unix采用了与众不同的实现方法,
它把上述步骤分解到两个单独的函数中去执行:fork()和exec()。 首先,fork()通过拷贝当前进程创建一个子进程。子进程与父进程的区别仅仅在于PID(每个进程唯一)、PPID(父进程的进程号,子进程将其设置为被拷贝进程的PID)和某些资源和统计量(例如,挂起的信号,他没有必要被继承)。exec()函数负责读取可执行文件并将其载入地址空间开始运行。把这两个函数组合起来使用的效果跟其他系统使用的单一函数的效果相似。

写时拷贝
传统的fork()系统调用直接把所有的资源复制给新创建的进程。这种事线过于简单并且效率低下,因为它拷贝的数据也许并不共享,更糟的情况是,如果新进程打算立即执行一个新的映像,那么所有的烤杯豆浆前功尽弃。Linux的fork()使用写时拷贝(copy-to-write)实现。写时拷贝是一种可以推迟甚至免除拷贝数据的技术。内核此时并不复制整个进程地址空间,而是让父进程和子进程共享同一个拷贝。
只有在需要写入的时候,数据才会被复制,从而使各个进程拥有各自的拷贝。也就是说,资源的复制只有在需要写入的时候才进行,在此之前,只是以只读方式共享。这种技术是地址空间上的页的拷贝被推迟到实际发生写入的时候才进行。在页根本不会被写入的情况下(举例来说,fork()后立即调用exec())它们就无须复制了。
fork()的实际开销就是复制父进程的页表以及给予进程创建唯一的进程描述符。在一般情况下,进程创建后都会马上运行一个可执行的文件,这种优化可以避免拷贝大量根本就不会被使用的数据(地址空间里常常包含数十兆的数据)。由于unix强调进程快速执行的能力,所以这个优化是很重要的。

fork()
Linux通过clone()系统调用实现fork()。这个调用通过一系列的参数标志来指明父、子进程需要共享的资源。fokr()、vfork()和__clone()库函数都根据各自需要的参数标志去调用clone(),然后由clone()去调用do_fork()。
do_fork()完成了创建中的大部分工作,它的定义在kernel/fork.c文件中。该函数调用copy_process()函数,然后让进程开始运行。copy_process()函数完成的工作很有意思:

  1. 调用dup_task_struct()为新进程创建一个内核栈、thread_info结构和task_struct,这些值与当前进程值相同。此时,子进程和父进程的描述符是完全相同的。
  2. 检查并确保新创建这个子进程后,当前用户所拥有的进程数目没有超出给它分配的资源的限制。
  3. 子进程着手使自己与父进程区别开来。进程描述符内的许多成员都要被清0或设为初始值。那些卜筮集成而来的进程描述符成员,主要是统计信息。task_struct中的大多数数据都依然为被修改。
  4. 子进程的状态被设置为TASK_UNINTERRUPTIBLE,以保证它不会投入运行。
  5. copy_process()调用copy_flags()以更新task_struct的flags成员。表明进程是否拥有超级用户权限的PF_SUPERPRIV标志被清0.表明进程还没有调用exec()函数的PF_FORKNOEXEC标志被设置。
  6. 调用alloc_pid()为新进程分配一个有效的PID。
  7. 根据传递给clone()的参数标志,copy_process()拷贝或共享打开的文件、文件系统信息、信号处理函数、进程地址空间和命名空间等。在一般情况下,这些资源会被给定进程的所有县城共享;否则,这些资源对每个进程是不同的,因此被拷贝到这里。
  8. 最后,copy_process()做扫尾工作并返回一个指向子进程的指针。
    再回到do_fork()函数,如果copy_process()函数成功返回,新创建的子进程被唤醒并让其投入运行。内核有意选择子进程首先执行。因为一般子进程都会马上调用exec()函数,这样可以避免写时拷贝的额外开销,如果父进程首先执行的话,有可能会开始向地址空间写入。

vfork()
除了不拷贝父进程的页表项外,vfork()系统调用和fork()的功能相同。子进程作为父进程的一个单独的线程在它的地址空间里运行,父进程被阻塞,知道子进程退出或执行exec()。子进程不能向地址空间写入。在过去的3BSD时期,这个优化是很有意义的,那时并未使用写时拷贝页来实现fork()。现在由于在执行fork()时引入了写时拷贝并且明确了子进程先执行,vfork()的好处就仅限于不拷贝父进程的页表项了。如果Linux将来fork()有了写时拷贝页表项,那么vfork()就彻底没用了。另外由于vfork()予以非常微妙(试想,如果exec()调用失败会发生什么),所以说理想情况下,系统最好不要调用vfork(),内核也不用实现它。完全可以把vfork()实现成一个普普通用的fork()——实际上,Linux2.2以前都是这么做的。

vfork()系统调用的实现是通过向clone()系统低啊用传递一个特殊标志来进行的。

  1. 在调用copy_process()时,task_struct的vfork_done被设置为NULL;
  2. 在执行do_fork()时,如果给定特别标志,则vfork_done会指向一个特定地址。
  3. 子进程先开始执行后,父进程不是马上恢复执行,而是一直等待,直到进程通过vfork_done指针向它发送信号。
  4. 在调用mm_release()时,该函数用于进程退出内存地址空间,并且检查vfork_done是否为空,如果不为空,则会向父进程发送信号。
  5. 回到do_fork(),父进程醒来并返回。
    如果一切执行顺利,子进程在新的地址空间里运行而父进程也恢复了在原地址空间的运行。这样。开销确实降低了,不过他的实现并不是优良的。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值