Linux内核分析之理解进程调度时机跟踪分析进程调度与进程切换的过程

SA16225055冯金明    原创作品转载请注明出处 

Linux内核分析》MOOC课程http://mooc.study.163.com/course/USTC-1000029000

实验内容

实验要求:

  • 理解Linux系统中进程调度的时机,可以在内核代码中搜索schedule()函数,看都是哪里调用了schedule(),判断我们课程内容中的总结是否准确;
  • 使用gdb跟踪分析一个schedule()函数 ,验证您对Linux系统进程调度与进程切换过程的理解
  • 特别关注并仔细分析switch_to中的汇编代码,理解进程上下文的切换机制,以及与中断上下文切换的关系;
  • 根据本周所学知识分析并理解Linux中进程调度与进程切换过程
实验截图:
  • 启动qemu,加载断点(schedule、context_switch和switch_to),如图一所示
  • 通过调试,查看进程切换的具体过程,如图二所示

图一 设置断点

图二 查看具体执行流程

理解进程调度时机跟踪分析进程调度和进程切换的过程

进程调度的时机:

  • 用户态进程无法实现主动调度,仅能通过陷入内核态后的某个时机点进行调度,即在中断处理过程中进行调度。
  • 中断处理过程(包括时钟中断、I/O中断、系统调用和异常)中,直接调用schedule(),或者返回用户态时根据need_resched标记调用schedule();
  • 内核线程可以直接调用schedule()进行进程切换,也可以在中断处理过程中进行调度,也就是说内核线程作为一类的特殊的进程可以主动调度,也可以被动调度;
进程的切换:
  • 为了控制进程的执行,内核必须有能力挂起正在CPU上执行的进程,并恢复以前挂起的某个进程的执行,这叫做进程切换、任务切换、上下文切换;
  • 挂起正在CPU上执行的进程,与中断时保存现场是不同的,中断前后是在同一个进程上下文中,只是由用户态转向内核态执行;
  • 进程上下文包含了进程执行需要的所有信息
    1. 用户地址空间: 包括程序代码,数据,用户堆栈等
    2. 控制信息 :进程描述符,内核堆栈等
    3. 硬件上下文(注意中断也要保存硬件上下文只是保存的方法不同)
  • schedule()函数选择一个新的进程来运行,并调用context_switch进行上下文的切换,这个宏调用switch_to来进行关键上下文切换
    1. next = pick_next_task(rq, prev);//进程调度算法都封装这个函数内部
    2. context_switch(rq, prev, next);//进程上下文切换
    3. switch_to利用了prev和next两个参数:prev指向当前进程,next指向被调度的进程
Linux系统的一般执行过程:

  • 最一般的情况:正在运行的用户态进程X切换到运行用户态进程Y的过程
    1. 正在运行的用户态进程X
    2. 发生中断——save cs:eip/esp/eflags(current) to kernel stack,then load cs:eip(entry of a specific ISR) and ss:esp(point to kernel stack).
    3. SAVE_ALL //保存现场
    4. 中断处理过程中或中断返回前调用了schedule(),其中的switch_to做了关键的进程上下文切换
    5. 标号1之后开始运行用户态进程Y(这里Y曾经通过以上步骤被切换出去过因此可以从标号1继续执行)
    6. restore_all//恢复现场
    7. iret - pop cs:eip/ss:esp/eflags from kernel stack
    8. 继续运行用户态进程Y
  • 几种特殊情况
    1. 通过中断处理过程中的调度时机,用户态进程与内核线程之间互相切换和内核线程之间互相切换,与最一般的情况非常类似,只是内核线程运行过程中发生中断没有进程用户态和内核态的转换;
    2. 内核线程主动调用schedule(),只有进程上下文的切换,没有发生中断上下文的切换,与最一般的情况略简略;
    3. 创建子进程的系统调用在子进程中的执行起点及返回用户态,如fork;
    4. 加载一个新的可执行程序后返回到用户态的情况,如execve;

总结:

根据前辈们的经验,小抄了一份总结,switch_to从A进程切换到B进程的步骤:
1.复制变量到寄存器当中:
[prev] ''a'' (prev) [prev] "d" (next)  
具体含义为:eax <== prev_Aeax<==%p(%ebp_A)和edx <== next_Aedx<==%n(%ebp_A)
2.保存进程A的ebp和eflags
具体代码为: pushf1
push1 %ebp
需要注意的是:esp仍然在A的堆栈中,则它们是被保存在A进程的内核堆栈中去了
3.保存当前esp至A进程的进程描述符中

具体代码为: movl %%esp,%[prev_sp]\n\t

具体含义为:prev_A->thread.sp=esp_A  在调用switch_to时,prev是指向A进程自身的进程描述符

4.从next(进程B)的描述符中取出先前B进程切换出去保存过的esp_B

具体代码为: movl %[next_sp], %%esp \n\t

具体含义为:esp_B=next_A->thread.sp

需要注意的是:在A进程中的next是指向B的进程描述符。从这个时候开始,CPU当前执行的进程已经是B进程了,因为esp已经指向B的内核堆栈。但是,现在的ebp仍然指向A进程的内核堆栈,所以所有局部变量仍然是A中的局部变量,比如next实质上是%n(%ebp_A),也就是next_A,即指向B的进程描述符。

5.把标号为1的指令地址保存到A进程描述符的ip域中:

具体代码为: movl $1f, %[prev_ip]\n\t

具体含义为:prev_A->thread.ip=%1f

当A进程下次从switch_to返回时,是从这条指令开始执行的!

6.将返回地址保存到堆栈,调用switch_to,由switch_to完成硬件上下文的切换:

具体代码为: pushl % [next_ip]\n\t

jmp switch_to \n

需要注意的是:如果之前B也被switch_to出去过,那么[next_ip]里存的就是下面这个1f的标号,但如果进程B刚刚被创建,之前没有被switch_to出去过,那么[next_ip]里存的将是ret_ftom_fork(参看copy_thread()函数)。 当这里switch_to()返回时,将返回值prev_A又写入了%eax,这就使得在switch_to宏里面eax寄存器始终保存的是prev_A的内容,更准确的说,是指向A进程描述符的“指针”。

7.从switch_to()返回后将继续从1:标号后面开始执行,修改ebp到B的内核堆栈,恢复B的eflags

具体代码为: popl %%ebp\n\t

popfl \n\t

如果从switch_to()返回后从这里继续运行,那么说明在此之前B肯定被switch_to调出过,因此此前肯定备份了ebp_B和flags_B,这里执行恢复操作。此时ebp已经是指向了B的内核堆栈,所以上面的prev,next等局部变量已经不是A进程堆栈中的了,而是B进程堆栈中的(B上次被切换出去之前也有这两个变量,所以代表着B堆栈中prev、next的值了),因为prev==%p(%ebp_B),而在B上次被切换出去之前,该位置保存的是B进程的描述符地址。如果这个时候就结束switch_to的话,在后面的代码中(即context_switch()函数中switch_to之后的代码)的prev变量是指向B进程的,因此,进程B就不知道是从哪个进程切换回来。context_switch()中switch_to之后的代码中,我们看到finish_task_switch(this_rq(),prev)中需要知道之前是从哪个进程切换过来的,因此,必须想办法保存A进程的描述符到B的堆栈中,这就是last的作用

8.将eax写入last,在B的堆栈中保存正确的prev信息

"=a"(last)  具体含义为:last_B = %eax

从context_switch()中可以看出调用switch_to的方法是:switch_to(prev,next,prev)!这里面的last其实是prev,在switch_to执行完成以后,prev_B就是正确的A进程描述符。last的作用相当于把进程A堆栈中的A进程描述符地址复制到进程B的堆栈中!

参考资料

http://blog.csdn.net/naiveorange/article/details/51171214

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值