本人学号后三位:146,原创作品转载请注明出处 https://github.com/mengning/linuxkernel/
实验名称:基于mykernel完成多进程的简单内核
- 实验要求:
- 完成一个简单的时间片轮转多道程序内核代码,参考代码见mykernel版本库。
- 详细分析该精简内核的源代码并给出实验截图,撰写一篇博客(署真实姓名或学号最后3位编号),并在博客文章中注明“原创作品转载请注明出处 + https://github.com/mengning/linuxkernel/ ”,博客内容的具体要求如下:
- 题目自拟,内容围绕操作系统是如何工作的进行;
- 博客中需要使用实验截图
- 博客内容中需要仔细分析进程的启动和进程的切换机制
- 总结部分需要阐明自己对“操作系统是如何工作的”理解
一、实验步骤
1、在实验楼的环境中打开终端。输入如下指令完成初始化、打补丁和编译。
cd LinuxKernel/linux-3.9.4 #进入目标目录
rm -rf mykernel #删除原有的mykernel
patch -p1 < ../mykernel_for_linux3.9.4sc.patch #打补丁
make allnoconfig #得到一个最基本的内核配置
make #编译内核请耐心等待
qemu -kernel arch/x86/boot/bzImage #在qemu模拟器上运行
运行结果如下:
2、分析代码
myinterrupt.c文件里定义了一个my_time_handler()函数,会输出一行“>>>>>>>>>>>my_time_handler here<<<<<<<<<<<<”。
mymain.c中定义了一个__initmy_start_kernel()函数,每1000个时钟周期输出一行提示“my_start_kernel here”。该循环不设结束条件,恒为真,是一个死循环,故程序不停地输出“>>>>>>>>>>>my_time_handler here<<<<<<<<<<<<”。
3、编写调度策略代码,实现系统的时间片轮转
从孟老师提供的开源项目mykernelhttps://github.com/mengning/mykernel中提取出mymain.c和myinterrupt.c,复制到原内核的mykernel文件夹下,覆盖掉原有的mymain.c和myinterrupt.c,并添加一个mypcb.h,用来定义进程控制块PCB。
输入如下指令重新编译并运行新的内核代码。
运行结果如下:
可以看到进程进行了切换。
二、代码分析
1、看头文件mypcb.h,在该头文件中定义了两个结构体,一个表示一个进程:
struct Thread {
unsigned long ip;//ip为instruction pointer ,用来指示当前进程的下一条指令的地址
unsigned long sp;//sp为stack pointer,用来指示下一条指令的栈顶指针
};
另一个表示一个进程控制块。
typedef struct PCB{
int pid;
volatile long state; /* -1 unrunnable, 0 runnable, >0 stopped */
unsigned long stack[KERNEL_STACK_SIZE];
/* CPU-specific state of this task */
struct Thread thread;
unsigned long task_entry;
struct PCB *next;
}tPCB;
这个结构体对应着Linux内核里的struct task,意义在于为进程提供抽象数据结构,把需要描述进程的元素统统用这个结构体封装起来。
PCB结构体中的各个字段含义如下:
- pid:进程号
- state:进程状态,在模拟系统中,所有进程控制块信息都会被创建出来,其初始化值就是-1,如果被调度运行起来,其值就会变成0
- stack:进程使用的堆栈
- thread:当前正在执行的线程信息
- task_entry:进程入口函数
- next:指向下一个PCB,模拟系统中所有的PCB是以链表的形式组织起来的。
- 这里还有一个函数的声明 my_schedule,它的实现在my_interrupt.c中,在mymain.c中的各个进程函数会根据一个全局变量的状态来决定是否调用它,从而实现主动调度。
2、分析mymain.c
/*
* linux/mykernel/mymain.c
*
* Kernel internal my_start_kernel
*
* Copyright (C) 2013 Mengning
*
*/
#include <linux/types.h>
#include <linux/string.h>
#include <linux/ctype.h>
#include <linux/tty.h>
#include <linux/vmalloc.h>
#include "mypcb.h"
tPCB task[MAX_TASK_NUM];
tPCB * my_current_task = NULL;
volatile int my_need_sched = 0;
void my_process(void);
void __init my_start_kernel(void)
{
int pid = 0;
int i;
/* Initialize process 0*/
task[pid].pid = pid;
task[pid].state = 0;/* -1 unrunnable, 0 runnable, >0 stopped */
task[pid].task_entry = task[pid].thread.ip = (unsigned long)my_process;
task[pid].thread.sp = (unsigned long)&task[pid].stack[KERNEL_STACK_SIZE-1];
task[pid].next = &task[pid];
/*fork more process */
for(i=1;i<MAX_TASK_NUM;i++)
{
memcpy(&task[i],&task[0],sizeof(tPCB));
task[i].pid = i;
task[i].state = -1;
task[i].thread.sp = (unsigned long)&task[i].stack[KERNEL_STACK_SIZE-1];
task[i].next = task[i-1].next;
task[i-1].next = &task[i];
}
/* start process 0 by task[0] */
pid = 0;
my_current_task = &task[pid];
asm volatile(
"movl %1,%%esp\n\t" /* set task[pid].thread.sp to esp */
"pushl %1\n\t" /* push ebp */
"pushl %0\n\t" /* push task[pid].thread.ip */
"ret\n\t" /* pop task[pid].thread.ip to eip */
"popl %%ebp\n\t"
:
: "c" (task[pid].thread.ip),"d" (task[pid].thread.sp) /* input c or d mean %ecx/%edx*/
);
}
void my_process(void)
{
int i = 0;
while(1)
{
i++;
if(i%10000000 == 0)
{
printk(KERN_NOTICE "this is process %d -\n",my_current_task->pid);
if(my_need_sched == 1)
{
my_need_sched = 0;
my_schedule();
}
printk(KERN_NOTICE "this is process %d +\n",my_current_task->pid);
}
}
}
这里的函数 my_start_kernel 是系统启动后,最先调用的函数,在这个函数里完成了0号进程的初始化和启动,并创建了其它的进程PCB,以方便后面的调度。在模拟系统里,每个进程的函数代码都是一样的,即 my_process 函数,my_process 在执行的时候,会打印出当前进程的 id,从而使得我们能够看到当前哪个进程正在执行。
另外,在 my_process 也会检查一个全局标志变量 my_need_sched,一旦发现其值为 1 ,就调用 my_schedule 完成进程的调度。
在my_start_kernel()里面是一段嵌入式汇编代码:
pid = 0;
my_current_task = &task[pid];
asm volatile(
"movl %1,%%esp\n\t" /* 把当前进程的sp赋给esp */
"pushl %1\n\t" /* 把ebp压栈 */
"pushl %0\n\t" /* 把当前进程的ip压栈 */
"ret\n\t"
"popl %%ebp\n\t" /* 弹出栈顶元素赋给eip */
:
: "c" (task[pid].thread.ip),"d" (task[pid].thread.sp)
/* "c" (task[pid].thread.ip)被特别声明,用ecx寄存器来储存task[pid].thread.ip的值
,并且可以用%0引用这个值,edx寄存器来储存task[pid].thread.sp的值*/
);
接着会进入my_process函数
void my_process(void)
{
int i = 0;
while(1)
{
i++;
if(i%10000000 == 0)
{
printk(KERN_NOTICE "this is process %d -\n",my_current_task->pid);
if(my_need_sched == 1)
{
my_need_sched = 0;
my_schedule();
}
printk(KERN_NOTICE "this is process %d +\n",my_current_task->pid);
}
}
}
全局标志变量 my_need_sched指示是否需要进程切换。这里是个暴力时间迭代,如果变量i一直自增到10000000,然后可以进入if判断,如果当前my_need_sched值为1,则进入my_schedule();进行进程调度。
3、分析myinterrupt.c
/*
* linux/mykernel/myinterrupt.c
*
* Kernel internal my_timer_handler
*
* Copyright (C) 2013 Mengning
*
*/
#include <linux/types.h>
#include <linux/string.h>
#include <linux/ctype.h>
#include <linux/tty.h>
#include <linux/vmalloc.h>
#include "mypcb.h"
extern tPCB task[MAX_TASK_NUM];
extern tPCB * my_current_task;
extern volatile int my_need_sched;
volatile int time_count = 0;
/*
* Called by timer interrupt.
* it runs in the name of current running process,
* so it use kernel stack of current running process
*/
void my_timer_handler(void)
{
#if 1
if(time_count%1000 == 0 && my_need_sched != 1)
{
printk(KERN_NOTICE ">>>my_timer_handler here<<<\n");
my_need_sched = 1;
}
time_count ++ ;
#endif
return;
}
void my_schedule(void)
{
tPCB * next;
tPCB * prev;
if(my_current_task == NULL
|| my_current_task->next == NULL)
{
return;
}
printk(KERN_NOTICE ">>>my_schedule<<<\n");
/* schedule */
next = my_current_task->next;
prev = my_current_task;
if(next->state == 0)/* -1 unrunnable, 0 runnable, >0 stopped */
{
/* switch to next process */
asm volatile(
"pushl %%ebp\n\t" /* save ebp */
"movl %%esp,%0\n\t" /* save esp */
"movl %2,%%esp\n\t" /* restore esp */
"movl $1f,%1\n\t" /* save eip */
"pushl %3\n\t"
"ret\n\t" /* restore eip */
"1:\t" /* next process start here */
"popl %%ebp\n\t"
: "=m" (prev->thread.sp),"=m" (prev->thread.ip)
: "m" (next->thread.sp),"m" (next->thread.ip)
);
my_current_task = next;
printk(KERN_NOTICE ">>>switch %d to %d<<<\n",prev->pid,next->pid);
}
else
{
next->state = 0;
my_current_task = next;
printk(KERN_NOTICE ">>>switch %d to %d<<<\n",prev->pid,next->pid);
/* switch to new process */
asm volatile(
"pushl %%ebp\n\t" /* save ebp */
"movl %%esp,%0\n\t" /* save esp */
"movl %2,%%esp\n\t" /* restore esp */
"movl %2,%%ebp\n\t" /* restore ebp */
"movl $1f,%1\n\t" /* save eip */
"pushl %3\n\t"
"ret\n\t" /* restore eip */
: "=m" (prev->thread.sp),"=m" (prev->thread.ip)
: "m" (next->thread.sp),"m" (next->thread.ip)
);
}
return;
}
这里 my_timer_handler 函数会被内核周期性的调用,每调用1000次,就去将全局变量my_need_sched的值修改为1,通知正在执行的进程执行调度程序my_schedule。即把my_need_sched置为1,表示将要切换进程,如果my_need_sched本来就是1,那么什么也不做。
在my_schedule函数中,完成进程的切换。进程切换是通过嵌入式汇编代码实现的。具体解析如下:
asm volatile(
"pushl %%ebp\n\t" /* 吧ebp压栈,用来保存ebp */
"movl %%esp,%0\n\t" /* 保存esp */
"movl %2,%%esp\n\t" /* 前一条指令的ip赋给esp */
"movl $1f,%1\n\t" /* 保存eip */
"pushl %3\n\t"
"ret\n\t" /* 下一条指令的eip压栈 */
"1:\t" /* 下一次执行从这里开始 */
"popl %%ebp\n\t"
: "=m" (prev->thread.sp),"=m" (prev->thread.ip)
: "m" (next->thread.sp),"m" (next->thread.ip)
);
三、总结:操作系统是如何工作的?
操作系统的两大要素:一是中断上下文(保存现场和恢复现场),即每一个进程发生中断时系统要记得他从哪里中断,下一次从哪里开始。这些是通过内核态堆栈实现的,包括有eip,esp,ebp,cs等寄存器的数据;然后加载创建的进程的上下文信息到相应的寄存器中,运行当前新建进程;运行完毕后根据系统的调度继续执行相应的进程。二是进程上下文的切换,即进程切换时这些内核态堆栈状态的改变。再加上用硬件传递中断信号,操作系统实现了和用户的交互。