简单分析
假设我的系统只有一种调度算法cfs
那么有个调度的队列 cfs_rq
所有running的进程都会 进入这个队列,不在running 或者其他情况会出队列,ok。则假设队列控制的算法有以下。
cfs_rq_enqueue
cfs_rq_dequeue
cfs_rq_pick
所操作的是进程描述符 task_struck.
那么很简单可以理解上述过程
scehed_pick ---->cfs_rq_pick就行了。
多个调度算法
那么如果除了cfs还有rt算法
那么就有两个调度队列,cfs_rq和rt_rq。
一个进程task_struck 有可能属于cfs和rt。
那么考虑 scehed_pick 是如何pick?
ok,Linux建立一个sched_class 的结构链表,sched_class_cfs和sched_class_rt或者还有其他的。顺序的从这么多个调度算法中选择一个合适的。
stop_sched_class -> -> rt_sched_class -> fair_sched_class -> idle_sched_class
如上。那么问题来了,如果前面的队列一直满足,后面的队列就永远得不到执行,这些sched_class之间没有个合理的逻辑吗?
目前看到的逻辑,任务dl 是最先满足的,rt次之,cfs随后,idle当然是最后的,这样的逻辑,基本上能让人有点信服。
再抽象一层sched_entity,
一般情况 cfs和rt或者其他的什么的调度算法的接口 enqueue或者dequeue 都是对task_struck 进行操作的。
但是Linux 这里再抽象一个sched_entity,每个task_struck 对应一个sched_entity 。调度算法对sched_entity操作就行了。
这样抽象我猜想有两个目的,一个是统一比较好看,和task_struck隔离。第二个是,为了下面的组调度做准备。
加入组调度
组调度的数据结构,和组织架构大概是如下这个样子
OK,如果Linux进行组调度,就不会说使用全局的cfs_rq队列,或者rt_rq队列。而是将这些队列分配到task_group中。大概流程是这样子的。
我们假设我们有两个组 GroupA 和GroupB A占2 B占1 就是有三次调用的情况下 A组会被调用两次,B组只有1次。
这个时候有一个进程启动了 task_struck task1
他选择A组,同理task2 可能也选择A task3可能选择B 如下
而A 和 B 不会记录 task的接口体,他记录task 的sched_entity 并用一个se[] 数组表示。
那么还有,task1 task2 有可能是cfs调度也有可能是rt,那么gruop结构体就用 cfs_se[] cfs_rq 和 rt_se[] rt_rq记录。
那么问题来了
task1 task2 属于cfs还是属于rt 是什么时候设置的?
在Android和linux里面没有看到,目前看到的是 0 也就是cfs,
那么有以下可能就是说,如果你不设置,就默认是0,或者继承父亲的等等这种默认策略。
scehed_pick 时候怎么pick?
按照pick三次 两次是A,ok。到了A,再使用这个策略
stop_sched_class -> dl_sched_class -> rt_sched_class -> fair_sched_class -> idle_sched_class
这个是说的通的。
但是要根据代码来。
组调度基本思想
来看下组调度
static struct task_struct *pick_next_task_fair(struct rq *rq)
{
struct task_struct *p;
struct cfs_rq *cfs_rq = &rq->cfs;
struct sched_entity *se;
if (!cfs_rq->nr_running)
return NULL;
do {
se = pick_next_entity(cfs_rq);
set_next_entity(cfs_rq, se);
cfs_rq = group_cfs_rq(se);
} while (cfs_rq);
p = task_of(se);
if (hrtick_enabled(rq))
hrtick_start_fair(rq, p);
return p;
}
代码很简单,其实在2.4以前是没有组调度的。就不会有group_cfs_rq这个队列,那么所有task都在全局的rq->cfs,就是刚开始的。
后面为了引入分组的概念,就有了组调度。
引入分组的概念后,原来对task直接进行的操作就变得不那么遍历,就引入了sched_entity。整体结构如下。
结合代码理解下
-
首先代码 struct cfs_rq *cfs_rq = &rq->cfs; 拿到全局的cfs_rq。
-
然后进行一次pick 拿到sched_entity se(假设是A cfs_rq) -----------sched_entity 和 task_group是可以相互转换的
-
然后把全局的cfs_rq 复制成现在的cfs_rq(假设是A cfs_rq)
-
然后是while循环,如果A下面没有节点了,就结束循环,但是A下面还有节点,就循环,再重新赋值,如此如此。知道根部。
-
那么假设我们在A的下面 task_gruop1 停止了,因为它的cfs_rq是空的。
-
接下来就把task_group1 转换成task_struck p。
-
最后就结束返回。
同理rt队列也是这样的:如果主调度器(),选择的是rt_sched_class 那就 pick_next_task_rt
那么就会从task_group A 的rt_rq开始调度
task_group不仅仅有cfs_rq 还有 rt_rq。
关于task_group 和组调度的详细我们接下来会详细分析。