深入分析 linux 调度机制
一.说明
本文以 linux-2.4.10为例主要分析Linux进程调度模块中的
schedule 函数及其相关的函数。另外相关的前提知识也会说
明。默认系统平台是自己的i386 架构的 pc。
二.前提知识
在进行 schedule 分析之前有必要简单说明一下系统启动过
程,内存分配使用等。这样才能自然过渡到schedule 模块。
首先是 Linux 各个功能模块之间的依赖关系:
可见进程调度是整个内核的核心。 但这部分, 我想说明的是,我的 pc 是怎样把操作系统从硬盘装载到内存中, 并启动进程调度模块的。然后才是后面对 schedule 的具体分析。首先,启动操作系统部分,涉及到到三个文件:
/arch/i386/boot/bootsect.s 、 /arch/i386/boot/setup.s 、/arch/i386/boot/compressed/head.s。编译安装好一个 Linux 系统后, bootsect.s 模块被放置在可启动设备的第一个扇区 (磁
盘引导扇区, 512 字节)。那么下面开始启动过程,三个文件在内存中的分布与位置的移动如下图。
在经过上图这一系列过程后, 程序跳转到 system 模块中的初始化程序 init 中执行,即 /init/main.c 文件。该程序执行一系列的初始化工作,如寄存器初始化、内存初始化、中断设置等。之后内存的分配如下图:
此后, CPU 有序地从内存中读取程序并执行。前面的main
从内核态移动到用户态后,操作系统即建立了任务0,即进
程调度程序。之后再由schedule 模块进行整个Linux 操作系
统中进程的创建(fork ),调度( schedule),销毁( exit )及
各种资源的分配与管理等操作了。值得一说的是schedule 将
创建的第一个进程是init (pid=1 ),请注意它不是前面的
/init/main.c 程序段。如果是在 GNU/Debian 系统下, init 进程将依次读取 rcS.d,rcN.d( rc0.d~rc6.d ), rc.local 三个 run
command 脚本等,之后系统的初始化就完成了,一系列系统
服务被启动了,系统进入单用户或者多用户状态。然后init
读取 /etc/inittab ,启动终端设备( (exec)getty)供用户登陆,如 debian 中会启动 6 个 tty ,你可以用组合键 ctrl+alt+Fn
F1~F6)来切换。
到这里就知道了Linux 怎样启动进程调度模块了,也知道了
进程调度模块启动的第一个进程init 及之后的系统初始化和
登陆流程。下面就回过头来分析schedule 代码及其相关函数
调用。
三.进程调度涉及的数据结构
文件: /linux/include/linux/sched.h
下面只简单介绍数据结构task_struct 中的两个字段。
在 Linux 中,进程( Linux 中用轻量级的进程来模拟线程)使用的核心数据结构。一个进程在核心中使用一个
task_struct 结构来表示,包含了大量描述该进程的信息,其
中与调度器相关的信息主要包括以下几个:
1. state
volatile long state; /* -1 unrunnable, 0 runnable, >0 stopped
*/
Linux 的进程状态主要分为三类:可运行的
TASK_RUNNING ,相当于运行态和就绪态) ;被挂起的
TASK_INTERRUPTIBLE 、TASK_UNINTERRUPTIBLE 和
TASK_STOPPED );不可运行的( TASK_ZOMBIE ),调度器
主要处理的是可运行和被挂起两种状态下的进程,其中
TASK_STOPPED 又专门用于SIGSTP 等 IPC 信号的响应,
而 TASK_ZOMBIE指的是已退出而暂时没有被父进程收回
资源的 " 僵死 "进程。
2. counter
long counter;
该属性记录的是当前时间片内该进程还允许运行的时间。
四.就绪进程选择算法(即进程调度算法)
文件: /kernel/sched.c
1.上下文切换
从一个进程的上下文切换到另一个进程的上下文,因为其发
生频率很高,所以通常都是调度器效率高低的关键。 schedule() 函数中调用了 switch_to 宏,这个宏实现了进程之间的真正切换,其代码存放于 include/i386/system.h 。switch_to 宏是用嵌
入式汇编写成的,较难理解。
由 switch_to() 实现,而它的代码段在 schedule()过程中