这篇说说内核的进程调度机制,进程调度是内核的一个重要工作,由调度器完成。
进程状态
内核调度器调度的实体(KSE, kernal schedule entry)是进程和线程。内核必须知道所有进程和线程的状态,比如把时间片给一个阻塞的进程是没有意义的。从内核的角度来看,进程的状态有3种:
1. 运行,表示正在运行的进程
2. 等待,没有运行,但是等待时间片运行的进程
3. 睡眠,也就是阻塞,包括可中断的阻塞和不可中断的阻塞。睡眠的进程在等待一个事件的发生,调度器无法在下一次任务切换时选择睡眠的进程
进程在几种状态中不断的切换
1表示运行的进程要等待某个事件,进入到了睡眠状态
2表示运行的进程交出CPU资源,进入到了等待状态
3表示睡眠的进程等待的事件发生了,它进入到等待状态,不能直接进入到运行状态
4表示等待的进程获得CPU资源,变成运行状态
5表示运行的进程结束,进入到终止状态
内核将所有的进程保存在一个进程表中,不论是运行,等待,睡眠。睡眠的进程会被特别标记出来,调度器知道它们无法立即运行,就不会在下一个任务切换时选择它们。睡眠的进程被分在多个队列中,它们会在适当的时候被唤醒。对于睡眠的进程,又分为两种:
1. TASK_INTERUPTIBLE,可中断的睡眠,当内核发送信号给该进程表示它等待的事情已经发生时,响应信号处理程序把进程状态改成TASK_RUNNING,表示进入可运行状态,只要调度器选中它就可以运行
2. TASK_UNINTERUPTIBLE,不可中断的睡眠,不能由外部信号唤醒,即不响应外部信号,只能由内核亲自唤醒。
所谓的僵尸进程是指进程资源已经被释放,但是还保存在进程表中的进程。通常造成僵尸进程的原因是子进程已经被终结,但是父进程没有调用wait4系统调用来确认父进程知道子进程已死亡。这样子进程由于没有被父进程确认死亡,但是已经释放了资源,变成了僵尸进程。
从执行权限的维度来考察进程状态,进程状态分为用户态和核心态。用户态只能访问进程自身的数据,是受限的。核心态具有无限权限,可以访问任意数据。
用户态到核心态的切换有两种方式,一种是用户态执行系统调用,会切换到核心态。第二种是中断,当中断发生时,也会切换到核心态。
对于抢占式调度模型来说,
1. 中断具有最高权限,可以抢占处于用户态或者核心态的进程的时间片
2. 当进程处于核心态并执行系统调用时,不能被其他进程抢占,当然中断除外
3. 在用户态执行的进程可以随时被抢占
调度器
调度器主要解决两个问题
1. 调度策略,即决定为每个进程分配多少运行时间,何时切换到下一个进程,下一个进程是什么
2. 上下文切换,即从进程A切换到进程B时,要保证进程B的执行环境和上次被撤销执行时完全一致,比如寄存器的内容,虚拟地址空间的各个数据结构。
Linux的调度器和传统基于时间片的调度器有所区别,它考虑的是进程的等待时间,即所有可运行的进程在一个就绪队列里面等待的时间。对CPU时间要求最严格的进程被挑选执行。就绪队列中的进程被组织成