Linux内核分析 实验二:完成一个简单的时间片轮转多道程序内核代码
by 吕然 + 原创作品转载请注明出处 + 《Linux内核分析》MOOC课程http://mooc.study.163.com/course/USTC-1000029000
这次作业,我们运行并分析一个精简的操作系统内核,理解操作系统是如何工作的。
一. 实验步骤与效果:
首先,安装并设置系统环境,仿照Kernel。这里因为直接应用了实验楼环境,所以省掉了很多麻烦。
然后,进入相关目录,通过操作cd LinuxKernel/linux-3.9.4。cd mykernel。在该目录下,创建并编辑实验所需要的三个文件,mymain.c,myinterrupt.c,mypcb.h.
编辑完成后,返回上一层目录,运用make,重新编译源代码。
图片表示是终端界面。
源代码的相关截图。这里也是仿照Kernel来写的。其中,为了实验效果,仿照课程,在myinterrupt.c中将调度的时间缩小。
编译完成后,运用操作qemu -kernel arch/x86/boot/bzImage,运行程序。
二. 源代码分析:
1> mypcb.h
<span style="font-size:18px;">#define MAX_TASK_NUM 4
#define KERNEL_STACK_SIZE 1024*8
/* CPU-specific state of this task */
struct Thread {
unsigned long ip;
unsigned long sp;
};
typedef struct PCB{
int pid;
volatile long state; /* -1 unrunnable, 0 runnable, >0 stopped */
char stack[KERNEL_STACK_SIZE];
/* CPU-specific state of this task */
struct Thread thread;
unsigned long task_entry;
struct PCB *next;
}tPCB;
void my_schedule(void);</span>
该文件定义了进程的最大数量:4,栈的大小: 1024*8。
对线程Thread做出了简单的结构定义。记录ip, 下一条要运行程序的地址;sp,栈顶地址。实验中也就是eip和esp(对于x86)。
该文件里对进程控制块(Processing Control Block,PCB)做出了简单的结构定义。定义进程管理的相关数据结构:进程ID;进程状态;堆栈(用到之前定义的栈的大小);线程;入口;下一个PCB;
调度器函数my_schedule。
2> mymain.c
<span style="font-size:18px;">#include <linux/types.h>
#include <linux/string.h>
#include <linux/ctype.h>
#include <linux/tty.h>
#include <linux/vmalloc.h>
#include "mypcb.h"
tPCB task[MAX_TASK_NUM];
tPCB * my_current_task = NULL;
volatile int my_need_sched = 0;
</span>
在mymain.c中引用了mypcb.h。创建存储PCB的task,其大小用到前面定义的最大任务数量4。设定当前任务的指针,是否需要调度的标记变量。
<span style="font-size:18px;">void my_process(void);
void __init my_start_kernel(void)
{
int pid = 0;
int i;
/* Initialize process 0*/
task[pid].pid = pid;
task[pid].state = 0;/* -1 unrunnable, 0 runnable, >0 stopped */
task[pid].task_entry = task[pid].thread.ip = (unsigned long)my_process;
task[pid].thread.sp = (unsigned long)&task[pid].stack[KERNEL_STACK_SIZE-1];
task[pid].next = &task[pid];
/*fork more process */
for(i=1;i<MAX_TASK_NUM;i++)
{
memcpy(&task[i],&task[0],sizeof(tPCB));
task[i].pid = i;
task[i].state = -1;
task[i].thread.sp = (unsigned long)&task[i].stack[KERNEL_STACK_SIZE-1];
task[i].next = task[i-1].next;
task[i-1].next = &task[i];
}
/* start process 0 by task[0] */
pid = 0;
my_current_task = &task[pid];
asm volatile(
"movl %1,%%esp\n\t" /* set task[pid].thread.sp to esp */
"pushl %1\n\t" /* push ebp */
"pushl %0\n\t" /* push task[pid].thread.ip */
"ret\n\t" /* pop task[pid].thread.ip to eip */
"popl %%ebp\n\t"
:
: "c" (task[pid].thread.ip),"d" (task[pid].thread.sp) /* input c or d mean %ecx/%edx*/
);
} </span>
运用 my_start_kernel初始化kernel。
首先初始化第一个进程,设置其id为0。这里所有的进程都做同一个工作,拥有同一个函数的入口,就是下面的my_process函数。下一进程指向0进程自己,因为初始化的时候只有一个进程0。
之后的1-3进程都是类似的方法fork出来。随着新进程的建立,下一进程指向就变成比自己大一个ID的进程,也就是0->1->2->3->0。
初始化所有进程后,调度开始第0号进程。
这里的汇编代码是这样工作的。将task[pid].thread.ip放入ecx寄存器,用0指代这个值,将task[pid].thread.sp放入edx寄存器,用1指代这个值。
movl %1,%esp 将sp存入esp中。
pushl %1 将sp入栈
pushl %0 将ip入栈
ret 将ip出栈并存入eip中,即我们让接下来运行ip里面存的地址下的程序,这里实际就是my_process函数。
popl %ebp 将esp指向值出栈,并存到ebp中
<span style="font-size:18px;">void my_process(void)
{
int i = 0;
while(1)
{
i++;
if(i%10000000 == 0)
{
printk(KERN_NOTICE "this is process %d -\n",my_current_task->pid);
if(my_need_sched == 1)
{
my_need_sched = 0;
my_schedule();
}
printk(KERN_NOTICE "this is process %d +\n",my_current_task->pid);
}
}
}</span>
这里简单介绍一下进程的工作,就是循环10000000遍,然后打印当前的进程号,然后看是否需要调度,即主动调度。
3> myinterrupt.c
<span style="font-size:18px;">#include <linux/ctype.h>
#include <linux/tty.h>
#include <linux/vmalloc.h>
#include "mypcb.h"
extern tPCB task[MAX_TASK_NUM];
extern tPCB * my_current_task;
extern volatile int my_need_sched;
volatile int time_count = 0;
/*
* Called by timer interrupt.
* it runs in the name of current running process,
* so it use kernel stack of current running process
*/
void my_timer_handler(void)
{
#if 1
if(time_count%1000 == 0 && my_need_sched != 1)
{
printk(KERN_NOTICE ">>>my_timer_handler here<<<\n");
my_need_sched = 1;
}
time_count ++ ;
#endif
return;
}
</span>
my_timer_handler的作用是如果每循环1000时间周期且目前调度标记值为0,就把调度值设为1,并打印相关信息。相当于1000次时候必然调度一次。1000就是我们时间片的大小,时间片越小,调度周期越短。
至于如何调度,要看接下来的函数my_schedule。
<span style="font-size:18px;">
void my_schedule(void)
{
tPCB * next;
tPCB * prev;
if(my_current_task == NULL
|| my_current_task->next == NULL)
{
return;
}</span>
简单做一个出错处理,应对没有接下来进程的错误情况。
<span style="font-size:18px;">
printk(KERN_NOTICE ">>>my_schedule<<<\n");
/* schedule */
next = my_current_task->next;
prev = my_current_task;</span>
正式进入调度部分,首先设定上前后进程,分别是当前进程和下一进程。
<span style="font-size:18px;">
if(next->state == 0)/* -1 unrunnable, 0 runnable, >0 stopped */
{
/* switch to next process */
asm volatile(
"pushl %%ebp\n\t" /* save ebp */
"movl %%esp,%0\n\t" /* save esp */
"movl %2,%%esp\n\t" /* restore esp */
"movl $1f,%1\n\t" /* save eip */
"pushl %3\n\t"
"ret\n\t" /* restore eip */
"1:\t" /* next process start here */
"popl %%ebp\n\t"
: "=m" (prev->thread.sp),"=m" (prev->thread.ip)
: "m" (next->thread.sp),"m" (next->thread.ip)
);
my_current_task = next;
printk(KERN_NOTICE ">>>switch %d to %d<<<\n",prev->pid,next->pid);
}</span>
若下一个进程在运行,曾做两个运行程序间的调度。
这里的汇编代码是这样工作的。
跟之前说的相同,这里prev->thread.sp用0指代,将prev->thread.ip用1指代,next->thread.sp用2指代,将next->thread.ip用3指代。
pushl %ebp 将ebp入栈保存
movl %esp,%0 将esp 存入 prev->thread.sp
movl %2,%%esp 将next->thread.sp存入esp中,即恢复下一个进程的sp
movl $1f,%1 将后面1:的位置保存在prev->thread.ip,存储下一个进程开始的地方,即存储eip
pushl %3 将next->thread.ip入栈保存
ret 将ip出栈并存入eip中,即我们让接下来运行ip里面存的地址下的程序,这里实际就是my_process函数。
popl %ebp 将esp指向值出栈,并存到ebp中
最后更新当前的运行任务为下一个,并打印状态。
<span style="font-size:18px;">
else
{
next->state = 0;
my_current_task = next;
printk(KERN_NOTICE ">>>switch %d to %d<<<\n",prev->pid,next->pid);
/* switch to new process */
asm volatile(
"pushl %%ebp\n\t" /* save ebp */
"movl %%esp,%0\n\t" /* save esp */
"movl %2,%%esp\n\t" /* restore esp */
"movl %2,%%ebp\n\t" /* restore ebp */
"movl $1f,%1\n\t" /* save eip */
"pushl %3\n\t"
"ret\n\t" /* restore eip */
: "=m" (prev->thread.sp),"=m" (prev->thread.ip)
: "m" (next->thread.sp),"m" (next->thread.ip)
);
}
return;
}</span>
如果下一个进程没有运行,即生成一个新的进程并运行。那么将下一个进程状态置为运行。然后做相关处理。
三. 总结:
计算机的三个法宝
1.存储程序计算机工作模型,计算机系统最最基础性的逻辑结构;
2.函数调用堆栈,高级语言得以运行的基础,只有机器语言和汇编语言的时候堆栈机制对于计算机来说并不 那么重要,但有了高级语言及函数,堆栈成为了计算机的基础功能;函数参数传递机制和局部变量存储
3.中断,多道程序操作系统的基点,没有中断机制程序只能从头一直运行结束才有可能开始运行其他程序。
操作系统中,函数的调用通过保存现场和恢复现场实现函数之间的调度。而在进程之间的调度,则要需要保存上下文和恢复上下文来实现调度。而这项工作需要堆栈的配合。
堆栈是C语言程序运行时必须的一个记录调用路径和参数的空间。其中包括:函数调用框架,传递参数,保存返回地址,提供局部变量空间等等。C语言编译器对堆栈的使用有一套的规则。
在调度进程的时候,操作系统会设置一个时间片,来科学地(或者说尽可能高效率的)利用CPU运行各个进程。将当前在运行的进程保存起来,恢复运行下一个需要的进程。或者创立新进程并运行。