SA16225055冯金明 原创作品转载请注明出处
《Linux内核分析》MOOC课程http://mooc.study.163.com/course/USTC-1000029000
实验内容
实验要求:
- 理解Linux系统中进程调度的时机,可以在内核代码中搜索schedule()函数,看都是哪里调用了schedule(),判断我们课程内容中的总结是否准确;
- 使用gdb跟踪分析一个schedule()函数 ,验证您对Linux系统进程调度与进程切换过程的理解;
- 特别关注并仔细分析switch_to中的汇编代码,理解进程上下文的切换机制,以及与中断上下文切换的关系;
- 根据本周所学知识分析并理解Linux中进程调度与进程切换过程
- 启动qemu,加载断点(schedule、context_switch和switch_to),如图一所示
- 通过调试,查看进程切换的具体过程,如图二所示
理解进程调度时机跟踪分析进程调度和进程切换的过程
进程调度的时机:
- 用户态进程无法实现主动调度,仅能通过陷入内核态后的某个时机点进行调度,即在中断处理过程中进行调度。
- 中断处理过程(包括时钟中断、I/O中断、系统调用和异常)中,直接调用schedule(),或者返回用户态时根据need_resched标记调用schedule();
- 内核线程可以直接调用schedule()进行进程切换,也可以在中断处理过程中进行调度,也就是说内核线程作为一类的特殊的进程可以主动调度,也可以被动调度;
- 为了控制进程的执行,内核必须有能力挂起正在CPU上执行的进程,并恢复以前挂起的某个进程的执行,这叫做进程切换、任务切换、上下文切换;
- 挂起正在CPU上执行的进程,与中断时保存现场是不同的,中断前后是在同一个进程上下文中,只是由用户态转向内核态执行;
- 进程上下文包含了进程执行需要的所有信息
- 用户地址空间: 包括程序代码,数据,用户堆栈等
- 控制信息 :进程描述符,内核堆栈等
- 硬件上下文(注意中断也要保存硬件上下文只是保存的方法不同)
- schedule()函数选择一个新的进程来运行,并调用context_switch进行上下文的切换,这个宏调用switch_to来进行关键上下文切换
- next = pick_next_task(rq, prev);//进程调度算法都封装这个函数内部
- context_switch(rq, prev, next);//进程上下文切换
- switch_to利用了prev和next两个参数:prev指向当前进程,next指向被调度的进程
- 最一般的情况:正在运行的用户态进程X切换到运行用户态进程Y的过程
- 正在运行的用户态进程X
- 发生中断——save cs:eip/esp/eflags(current) to kernel stack,then load cs:eip(entry of a specific ISR) and ss:esp(point to kernel stack).
- SAVE_ALL //保存现场
- 中断处理过程中或中断返回前调用了schedule(),其中的switch_to做了关键的进程上下文切换
- 标号1之后开始运行用户态进程Y(这里Y曾经通过以上步骤被切换出去过因此可以从标号1继续执行)
- restore_all//恢复现场
- iret - pop cs:eip/ss:esp/eflags from kernel stack
- 继续运行用户态进程Y
- 几种特殊情况
- 通过中断处理过程中的调度时机,用户态进程与内核线程之间互相切换和内核线程之间互相切换,与最一般的情况非常类似,只是内核线程运行过程中发生中断没有进程用户态和内核态的转换;
- 内核线程主动调用schedule(),只有进程上下文的切换,没有发生中断上下文的切换,与最一般的情况略简略;
- 创建子进程的系统调用在子进程中的执行起点及返回用户态,如fork;
- 加载一个新的可执行程序后返回到用户态的情况,如execve;
总结:
具体代码为: movl %%esp,%[prev_sp]\n\t
具体含义为:prev_A->thread.sp=esp_A 在调用switch_to时,prev是指向A进程自身的进程描述符
4.从next(进程B)的描述符中取出先前B进程切换出去保存过的esp_B
具体代码为: movl %[next_sp], %%esp \n\t
具体含义为:esp_B=next_A->thread.sp
需要注意的是:在A进程中的next是指向B的进程描述符。从这个时候开始,CPU当前执行的进程已经是B进程了,因为esp已经指向B的内核堆栈。但是,现在的ebp仍然指向A进程的内核堆栈,所以所有局部变量仍然是A中的局部变量,比如next实质上是%n(%ebp_A),也就是next_A,即指向B的进程描述符。
5.把标号为1的指令地址保存到A进程描述符的ip域中:
具体代码为: movl $1f, %[prev_ip]\n\t
具体含义为:prev_A->thread.ip=%1f
当A进程下次从switch_to返回时,是从这条指令开始执行的!
6.将返回地址保存到堆栈,调用switch_to,由switch_to完成硬件上下文的切换:
具体代码为: pushl % [next_ip]\n\t
jmp switch_to \n
需要注意的是:如果之前B也被switch_to出去过,那么[next_ip]里存的就是下面这个1f的标号,但如果进程B刚刚被创建,之前没有被switch_to出去过,那么[next_ip]里存的将是ret_ftom_fork(参看copy_thread()函数)。 当这里switch_to()返回时,将返回值prev_A又写入了%eax,这就使得在switch_to宏里面eax寄存器始终保存的是prev_A的内容,更准确的说,是指向A进程描述符的“指针”。
7.从switch_to()返回后将继续从1:标号后面开始执行,修改ebp到B的内核堆栈,恢复B的eflags
具体代码为: popl %%ebp\n\t
popfl \n\t
如果从switch_to()返回后从这里继续运行,那么说明在此之前B肯定被switch_to调出过,因此此前肯定备份了ebp_B和flags_B,这里执行恢复操作。此时ebp已经是指向了B的内核堆栈,所以上面的prev,next等局部变量已经不是A进程堆栈中的了,而是B进程堆栈中的(B上次被切换出去之前也有这两个变量,所以代表着B堆栈中prev、next的值了),因为prev==%p(%ebp_B),而在B上次被切换出去之前,该位置保存的是B进程的描述符地址。如果这个时候就结束switch_to的话,在后面的代码中(即context_switch()函数中switch_to之后的代码)的prev变量是指向B进程的,因此,进程B就不知道是从哪个进程切换回来。context_switch()中switch_to之后的代码中,我们看到finish_task_switch(this_rq(),prev)中需要知道之前是从哪个进程切换过来的,因此,必须想办法保存A进程的描述符到B的堆栈中,这就是last的作用。
8.将eax写入last,在B的堆栈中保存正确的prev信息
"=a"(last) 具体含义为:last_B = %eax
从context_switch()中可以看出调用switch_to的方法是:switch_to(prev,next,prev)!这里面的last其实是prev,在switch_to执行完成以后,prev_B就是正确的A进程描述符。last的作用相当于把进程A堆栈中的A进程描述符地址复制到进程B的堆栈中!
参考资料
http://blog.csdn.net/naiveorange/article/details/51171214