内核源码阅读(八)进程调度器的实现

调度器的任务就是使程序之间共享CPU时间,创造并行执行的假象。其可分为两个方面:一是调度策略;二是上下文切换。
1.总览

一般原理:按所能分配的计算能力,向系统中每个进程提供最大的公正性。
调度器对于进程等待时间的记录如下图所示。所有的可运行程序都按时间在红黑树中排序。就绪队列装备了虚拟时钟,其精确速度依赖于当前等待调度器挑选的进程的数目,约为实时时钟速度的1/4。
这里写图片描述
2.数据结构
调度器子系统各组件概观如下图所示
这里写图片描述
激活调度方法:
1)直接由进程放弃CPU;
2)周期性机制,以固定频率运行,不时检测是否进行进程切换。
task_struct中与调度相关的成员:

<sched.h>
struct task_struct {
......
int prio, static_prio, normal_prio; unsigned int rt_priority;

struct list_head run_list;
const struct sched_class *sched_class; struct sched_entity se;

unsigned int policy; cpumask_t cpus_allowed; unsigned int time_slice;
.....
}

prio、normal_prio:进程动态优先级
static_prio:进程静态优先级,在进程启动时就被分配,可通过nice和sched_setscheduler函数进行修改。
rt_priority:表示实时进程优先级。最高优先级99,最低优先级0。
sched_class:表示该进程所属的调度类。
policy:保存进程调度策略,Linux可取值为:SCHED_NORMAL用于普通进程,SCHED_BATCH用于非交互、CPU使用密集的批处理进程,SCHED_IDLE权重相对较小,SCHED_FIFO使用先进先出机制,SCHED_RR使用循环方法,两个都用于软实时进程。
cpus_allow:位域,用来限制执行进程的CPU。
run_list:用于维护包含各进程的一个运行表
time_slice::指定进程可使用CPU的剩余时间段。

调度器类
其结构如下:

1.  struct sched_class {  
2.    const struct sched_class *next;   
3.  /* 向就绪队列添加新进程*/
4.    void (*enqueue_task) (struct rq *rq, struct task_struct *p, int flags);   /* 从就绪队列中删除一个进程*/
5.    void (*dequeue_task) (struct rq *rq, struct task_struct *p, int flags);   /* 进程自愿放弃对处理器的控制权时调用sched_yield->yield_task */
6.    void (*yield_task) (struct rq *rq);  
7.  /* 用一个新唤醒的进程类抢占当前进程 */
8.    void (*check_preempt_curr) (struct rq *rq, struct task_struct *p, int flags);  
9.  /*  选择下一个要运行的进程*/
10.    struct task_struct * (*pick_next_task) (struct rq *rq);  
11. /* 用一个进程替代当前运行的进程 */
12.   void (*put_prev_task) (struct rq *rq, struct task_struct *p);  
14.#ifdef CONFIG_SMP    /* 选择就绪队列*/
15.    int  (*select_task_rq)(struct rq *rq, struct task_struct *p,  
16.                   int sd_flag, int flags);  
17.  
18.    void (*pre_schedule) (struct rq *this_rq, struct task_struct *task);  
19.    void (*post_schedule) (struct rq *this_rq);  
20.    void (*task_waking) (struct rq *this_rq, struct task_struct *task);  
21.    void (*task_woken) (struct rq *this_rq, struct task_struct *task);  
22.  
23.    void (*set_cpus_allowed)(struct task_struct *p,  
24.                 const struct cpumask *newmask);  
25.  
26.    void (*rq_online)(struct rq *rq);  
27.    void (*rq_offline)(struct rq *rq);  
28.#endif  
29.  /* 设置当前执行的进程 */
30.    void (*set_curr_task) (struct rq *rq);  
31.  /* 在每次激活周期性调度器时,由周期性调度器调用 */
32. void (*task_tick) (struct rq *rq, struct task_struct *p, int queued);  
33.   /* 创建一个新进程*/
34.  void (*task_fork) (struct task_struct *p);  
35.  
36.    void (*switched_from) (struct rq *this_rq, struct task_struct *task,  
37.                   int running);  
38.    void (*switched_to) (struct rq *this_rq, struct task_struct *task,  
39.                 int running);  
40.    void (*prio_changed) (struct rq *this_rq, struct task_struct *task,  
41.                 int oldprio, int running);  
42.  
43.    unsigned int (*get_rr_interval) (struct rq *rq,  
44.                     struct task_struct *task);  
45.  
46.#ifdef CONFIG_FAIR_GROUP_SCHED  
47.    void (*task_move_group) (struct task_struct *p, int on_rq);  
48.#endif  
49.};  
50.  /* 用于负载均衡* /
51.struct load_weight {  
52.    unsigned long weight, inv_weight;  
53.};  

就绪队列
核心调度器用于管理活动进程的主要数据结构称之为就绪队列。每个CPU都有自己的就绪队列,一个进程不可能出现在多个就绪队列,即不能多个CPU不能运行一个进程。
就绪队列的结构如下所示。

kernel/sched.c
struct rq {
unsigned long nr_running;
#define CPU_LOAD_IDX_MAX 5
unsigned long cpu_load[CPU_LOAD_IDX_MAX];
......
struct load_weight load;

struct cfs_rq cfs; struct rt_rq rt;

struct task_struct *curr, *idle; u64 clock;
......
};
    nr_running:制定了队列上可运行进程的数目。
    load:提供了就绪队列当前负荷的度量。
    cpu_load:跟踪当前的负荷状态。
    cfs和rt:嵌入的子就绪队列,分别用于完全公平调度器和实时调度器。
    curr:指向当前运行的进程实例。
    idle:指向idle进程的task_struct实例。
    clock和pre_raw_clock:用于实现就绪队列自身的时钟。

调度实体
调度器的操作实体结构如下:

<sched.h>
struct sched_entity {
struct load_weight load; /* 用于负载均衡 */
struct rb_node run_node; unsigned int on_rq;
u64 exec_start;
u64 sum_exec_runtime; u64 vruntime;
u64 prev_sum_exec_runtime;
......
}
load:指定了权重,决定了各个实体占队列总负荷的比例。
    run_node:标准的树结点,使得实体可以在红黑树上排序。
    on_rq:表示该实体当前是否在就绪队列上接受调度。
exec_start:每次调用时,会计算当前时间和exec_start之间的差值,exec则更新到当前时间,差值则被加到sun_exec_time上。
vruntime:统计在进程执行期间虚拟时钟上流逝的时间数量。
pre_sun_exec_runtime:保存进程被撤销时的值。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值