Linux内核分析之理解进程调度时机跟踪分析进程调度与进程切换的过程

最新推荐文章于 2021-04-30 06:55:42 发布

Kimi_ming

最新推荐文章于 2021-04-30 06:55:42 发布

阅读量729

点赞数

分类专栏： kernel内核分析文章标签： Linux 进程切换进程调度时机

本文链接：https://blog.csdn.net/kimi_ming/article/details/69948596

版权

kernel内核分析专栏收录该内容

8 篇文章 0 订阅

订阅专栏

SA16225055冯金明原创作品转载请注明出处

《Linux内核分析》MOOC课程http://mooc.study.163.com/course/USTC-1000029000

实验内容

实验要求：

理解Linux系统中进程调度的时机，可以在内核代码中搜索schedule()函数，看都是哪里调用了schedule()，判断我们课程内容中的总结是否准确；
使用gdb跟踪分析一个schedule()函数，验证您对Linux系统进程调度与进程切换过程的理解；
特别关注并仔细分析switch_to中的汇编代码，理解进程上下文的切换机制，以及与中断上下文切换的关系；
根据本周所学知识分析并理解Linux中进程调度与进程切换过程

实验截图：

启动qemu，加载断点（schedule、context_switch和switch_to），如图一所示
通过调试，查看进程切换的具体过程，如图二所示

图一设置断点

图二查看具体执行流程

理解进程调度时机跟踪分析进程调度和进程切换的过程

进程调度的时机：

用户态进程无法实现主动调度，仅能通过陷入内核态后的某个时机点进行调度，即在中断处理过程中进行调度。
中断处理过程（包括时钟中断、I/O中断、系统调用和异常）中，直接调用schedule()，或者返回用户态时根据need_resched标记调用schedule()；
内核线程可以直接调用schedule()进行进程切换，也可以在中断处理过程中进行调度，也就是说内核线程作为一类的特殊的进程可以主动调度，也可以被动调度；

进程的切换：

为了控制进程的执行，内核必须有能力挂起正在CPU上执行的进程，并恢复以前挂起的某个进程的执行，这叫做进程切换、任务切换、上下文切换；
挂起正在CPU上执行的进程，与中断时保存现场是不同的，中断前后是在同一个进程上下文中，只是由用户态转向内核态执行；
进程上下文包含了进程执行需要的所有信息

1. 用户地址空间：包括程序代码，数据，用户堆栈等
2. 控制信息：进程描述符，内核堆栈等
3. 硬件上下文（注意中断也要保存硬件上下文只是保存的方法不同）

schedule()函数选择一个新的进程来运行，并调用context_switch进行上下文的切换，这个宏调用switch_to来进行关键上下文切换

1. next = pick_next_task(rq, prev);//进程调度算法都封装这个函数内部
2. context_switch(rq, prev, next);//进程上下文切换
3. switch_to利用了prev和next两个参数：prev指向当前进程，next指向被调度的进程

Linux系统的一般执行过程：

最一般的情况：正在运行的用户态进程X切换到运行用户态进程Y的过程

1. 正在运行的用户态进程X
2. 发生中断——save cs:eip/esp/eflags(current) to kernel stack,then load cs:eip(entry of a specific ISR) and ss:esp(point to kernel stack).
3. SAVE_ALL //保存现场
4. 中断处理过程中或中断返回前调用了schedule()，其中的switch_to做了关键的进程上下文切换
5. 标号1之后开始运行用户态进程Y(这里Y曾经通过以上步骤被切换出去过因此可以从标号1继续执行)
6. restore_all//恢复现场
7. iret - pop cs:eip/ss:esp/eflags from kernel stack
8. 继续运行用户态进程Y

几种特殊情况

1. 通过中断处理过程中的调度时机，用户态进程与内核线程之间互相切换和内核线程之间互相切换，与最一般的情况非常类似，只是内核线程运行过程中发生中断没有进程用户态和内核态的转换；
2. 内核线程主动调用schedule()，只有进程上下文的切换，没有发生中断上下文的切换，与最一般的情况略简略；
3. 创建子进程的系统调用在子进程中的执行起点及返回用户态，如fork；
4. 加载一个新的可执行程序后返回到用户态的情况，如execve；

总结：

 
   根据前辈们的经验，小抄了一份总结，switch_to从A进程切换到B进程的步骤： 
  

 
复制变量到寄存器当中： 
  

 
   [prev] ''a'' (prev) [prev] "d" (next)   
  

 
   具体含义为：eax <== prev_A或eax<==%p(%ebp_A)和edx <== next_A或edx<==%n(%ebp_A)  
  

 
保存进程A的ebp和eflags 
  

 
   具体代码为： pushf1 
  

 
   push1 %ebp 
  

 
   需要注意的是：esp仍然在A的堆栈中，则它们是被保存在A进程的内核堆栈中去了 
  

 
保存当前esp至A进程的进程描述符中 
  

具体代码为： movl %%esp,%[prev_sp]\n\t

具体含义为:prev_A->thread.sp=esp_A 在调用switch_to时，prev是指向A进程自身的进程描述符

4.从next（进程B）的描述符中取出先前B进程切换出去保存过的esp_B

具体代码为： movl %[next_sp], %%esp \n\t

具体含义为：esp_B=next_A->thread.sp

需要注意的是：在A进程中的next是指向B的进程描述符。从这个时候开始，CPU当前执行的进程已经是B进程了，因为esp已经指向B的内核堆栈。但是，现在的ebp仍然指向A进程的内核堆栈，所以所有局部变量仍然是A中的局部变量，比如next实质上是%n(%ebp_A)，也就是next_A，即指向B的进程描述符。

5.把标号为1的指令地址保存到A进程描述符的ip域中：

具体代码为： movl $1f, %[prev_ip]\n\t

具体含义为：prev_A->thread.ip=%1f

当A进程下次从switch_to返回时，是从这条指令开始执行的！

6.将返回地址保存到堆栈，调用switch_to，由switch_to完成硬件上下文的切换：

具体代码为： pushl % [next_ip]\n\t

jmp switch_to \n

需要注意的是：如果之前B也被switch_to出去过，那么[next_ip]里存的就是下面这个1f的标号，但如果进程B刚刚被创建，之前没有被switch_to出去过，那么[next_ip]里存的将是ret_ftom_fork（参看copy_thread()函数）。当这里switch_to()返回时，将返回值prev_A又写入了%eax，这就使得在switch_to宏里面eax寄存器始终保存的是prev_A的内容，更准确的说，是指向A进程描述符的“指针”。

7.从switch_to()返回后将继续从1：标号后面开始执行，修改ebp到B的内核堆栈，恢复B的eflags

具体代码为： popl %%ebp\n\t

popfl \n\t

如果从switch_to()返回后从这里继续运行，那么说明在此之前B肯定被switch_to调出过，因此此前肯定备份了ebp_B和flags_B，这里执行恢复操作。此时ebp已经是指向了B的内核堆栈，所以上面的prev，next等局部变量已经不是A进程堆栈中的了，而是B进程堆栈中的(B上次被切换出去之前也有这两个变量，所以代表着B堆栈中prev、next的值了)，因为prev==%p(%ebp_B)，而在B上次被切换出去之前，该位置保存的是B进程的描述符地址。如果这个时候就结束switch_to的话，在后面的代码中（即context_switch()函数中switch_to之后的代码）的prev变量是指向B进程的，因此，进程B就不知道是从哪个进程切换回来。context_switch()中switch_to之后的代码中，我们看到finish_task_switch(this_rq(),prev)中需要知道之前是从哪个进程切换过来的，因此，必须想办法保存A进程的描述符到B的堆栈中，这就是last的作用。

8.将eax写入last，在B的堆栈中保存正确的prev信息

"=a"(last) 具体含义为：last_B = %eax

从context_switch()中可以看出调用switch_to的方法是：switch_to(prev,next,prev)!这里面的last其实是prev，在switch_to执行完成以后，prev_B就是正确的A进程描述符。last的作用相当于把进程A堆栈中的A进程描述符地址复制到进程B的堆栈中！

参考资料

http://blog.csdn.net/naiveorange/article/details/51171214