本篇主要讲解linux的组调度。一般操作系统的调度实体是进程,但对于支持多用户的操作系统linux来说,有些场景可能以进程为调度实体就无法满足需求。
如,一台linux机器上有两个用户A和B。若A有10个进程,B有2个进程。如果以进程为调度实体,则会出现A用户的进程运行时间是B进程运行时间的5倍。如果这是用户付费的虚拟机用户,这对于B用户很不公平。为了解决该类问题,linux引入了组调度。
组调度原理
为了实现组调度,linux不在以进程作为调度实体,改以进程组作为调度实体。实际中组调度主要是针对完全公平调度算法(completely fair schedule)实现的。其基本流程如下:
- 首先根据CFS调度算法选出需要调度的最优实体。
- 如果筛选出的最优调度实体为一个单独的进程,则直接运行即可。
- 若果筛选出的最优调度实体为一个进程组,则在该进程组范围内继续使用CFS调度算法选出该进程组内的最优调度实体,即重复步骤1,直至筛选出的调度实体为一个单独可运行的进程为止。
注意,进程组可以递归包含进程组,即进程组不仅可以包含进程,还可以包含其他的进程组。
以上面的多用户linux操作系统为例,当采用组调度时,用户A和用户B分别作为两个进程组。组调度分配给进程组A和进程组B相同的时间片,假设为100ms,这样进程组A由于有10个进程,平均每个进程分配的时间为10ms,而进程组B每个进程可以分配的时间片为50ms,这样保证了调度的公平性。
代码流程分析
我们已经知道,所有的调度切换都是通过调用schedule函数完成的。在schedule函数中,调用pick_next_task函数选择下一个调度实体。
在pick_next_task函数中,流程如下:
1. 若前一个进程采用的调度器为CFS调度器或者idle调度器且当前cpu的运行队列上的进程都采用的时CFS调度算法,则直接调用pick_next_task_fair函数选择下一个调度实体。
2. 否则按照优先级从高到低的顺序逐个遍历所有调度类,获取下一个最优的调度实体。
3. 在pick_next_task_fair函数中,有如下的do while循环。在循环中,通过pick_next_entity函数从cfs调度器的运行队列上获取下一个最优的调度实体se,并找到调度实体se对应的cfs运行队列cfs_rq。
若cfs_rq为空,则说明调度实体se为进程,可以直接运行了;否则调度实体se为进程组,需要继续在进程组中利用cfs调度算法递归选择下一个最优的调度实体,直至选择出的调度实体为可运行进程。
从上面可以看出,调度实体sched_entity结构体中my_q成员用于表示被该调度实体所拥有的cfs运行队列。若my_q为空,表示该调度实体为进程;否则为进程组。通过这种方法可以判断调度实体的类型(进程/进程组)。
组调度总结如下:
参考: