在此练习中,需要通过阅读代码来了解:
- 操作系统镜像文件 ucore.img 是如何一步一步生成的?(需要比较详细地解释 Makefile 中
每一条相关命令和命令参数的含义,以及说明命令导致的结果) - 一个被系统认为是符合规范的硬盘主引导扇区的特征是什么?
[练习1.1]
1、生成ucore.img需要kernel和bootblock
生成ucore.img的代码如下:
$(UCOREIMG): $(kernel) $(bootblock)
(
V
)
d
d
i
f
=
/
d
e
v
/
z
e
r
o
o
f
=
(V)dd if=/dev/zero of=
(V)ddif=/dev/zeroof=@ count=10000
(
V
)
d
d
i
f
=
(V)dd if=
(V)ddif=(bootblock) of=$@ conv=notrunc
(
V
)
d
d
i
f
=
(V)dd if=
(V)ddif=(kernel) of=$@ seek=1 conv=notrunc
$(call create_target,ucore.img)
首先先创建一个大小为10000字节的块儿,然后再将bootblock拷贝过去。
生成ucore.img需要先生成kernel和bootblock
2、生成kernel
而生成kernel的代码如下:
$(kernel): tools/kernel.ld
$(kernel):
(
K
O
B
J
S
)
@
e
c
h
o
"
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
(KOBJS) @echo "bbbbbbbbbbbbbbbbbbbbbb
(KOBJS)@echo"bbbbbbbbbbbbbbbbbbbbbb(KOBJS)"
@echo + ld $@
(
V
)
(V)
(V)(LD) $(LDFLAGS) -T tools/kernel.ld -o $@
(
K
O
B
J
S
)
@
(KOBJS) @
(KOBJS)@(OBJDUMP) -S $@ >
(
c
a
l
l
a
s
m
f
i
l
e
,
k
e
r
n
e
l
)
@
(call asmfile,kernel) @
(callasmfile,kernel)@(OBJDUMP) -t $@ | KaTeX parse error: Expected group after '^' at position 39: …d; s/ .* / /; /^̲$/d’ > $(call symfile,kernel)
通过make V=指令得到执行的具体命令如下:
ld -m elf_i386 -nostdlib -T tools/kernel.ld -o bin/kernel obj/kern/init/init.o obj/kern/libs/readline.o obj/kern/libs/stdio.o obj/kern/debug/kdebug.o obj/kern/debug/kmonitor.o obj/kern/debug/panic.o obj/kern/driver/clock.o obj/kern/driver/console.o obj/kern/driver/intr.o obj/kern/driver/picirq.o obj/kern/trap/trap.o obj/kern/trap/trapentry.o obj/kern/trap/vectors.o obj/kern/mm/pmm.o obj/libs/printfmt.o obj/libs/string.o
1
然后根据其中可以看到,要生成kernel,需要用GCC编译器将kern目录下所有的.c文件全部编译生成的.o文件的支持。具体如下:
obj/kern/init/init.o
obj/kern/libs/readline.o
obj/kern/libs/stdio.o
obj/kern/debug/kdebug.o
obj/kern/debug/kmonitor.o
obj/kern/debug/panic.o
obj/kern/driver/clock.o
obj/kern/driver/console.o
obj/kern/driver/intr.o
obj/kern/driver/picirq.o
obj/kern/trap/trap.o
obj/kern/trap/trapentry.o
obj/kern/trap/vectors.o
obj/kern/mm/pmm.o
obj/libs/printfmt.o
obj/libs/string.o
3、生成bootblock
而生成bootblock的代码如下:
$(bootblock):
(
c
a
l
l
t
o
o
b
j
,
(call toobj,
(calltoobj,(bootfiles)) |
(
c
a
l
l
t
o
t
a
r
g
e
t
,
s
i
g
n
)
@
e
c
h
o
"
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
(call totarget,sign) @echo "========================
(calltotarget,sign)@echo"========================(call toobj,$(bootfiles))"
@echo + ld $@
(
V
)
(V)
(V)(LD) $(LDFLAGS) -N -e start -Ttext 0x7C00 $^ -o
(
c
a
l
l
t
o
o
b
j
,
b
o
o
t
b
l
o
c
k
)
@
(call toobj,bootblock) @
(calltoobj,bootblock)@(OBJDUMP) -S $(call objfile,bootblock) >
(
c
a
l
l
a
s
m
f
i
l
e
,
b
o
o
t
b
l
o
c
k
)
@
(call asmfile,bootblock) @
(callasmfile,bootblock)@(OBJCOPY) -S -O binary $(call objfile,bootblock)
(
c
a
l
l
o
u
t
f
i
l
e
,
b
o
o
t
b
l
o
c
k
)
@
(call outfile,bootblock) @
(calloutfile,bootblock)@(call totarget,sign) $(call outfile,bootblock) $(bootblock)
同样根据make V=指令打印的结果,得到要生成bootblock,首先需要生成bootasm.o、bootmain.o、sign,
下列代码为生成bootasm.o、bootmain.o的代码,由宏定义批量实现了。
bootfiles = $(call listf_cc,boot)
(
f
o
r
e
a
c
h
f
,
(foreach f,
(foreachf,(bootfiles),
(
c
a
l
l
c
c
c
o
m
p
i
l
e
,
(call cc_compile,
(callcccompile,(f),
(
C
C
)
,
(CC),
(CC),(CFLAGS) -Os -nostdinc))
而实际的命令在make V=指令结果里可以看到。
下述是由bootasm.S生成bootasm.o的具体命令:
gcc -Iboot/ -fno-builtin -Wall -ggdb -m32 -gstabs -nostdinc -fno-stack-protector -Ilibs/ -Os -nostdinc -c boot/bootasm.S -o obj/boot/bootasm.o
下述是由bootmain.c生成bootmain.o的具体命令
gcc -Iboot/ -fno-builtin -Wall -ggdb -m32 -gstabs -nostdinc -fno-stack-protector -Ilibs/ -Os -nostdinc -c boot/bootmain.c -o obj/boot/bootmain.o
至于上述命令的具体参数,查阅资料罗列如下:
- -ggdb 生成可供gdb使用的调试信息
- -m32 生成适用于32位环境的代码
- -gstabs 生成stabs格式的调试信息
- -nostdinc 不使用标准库
- -fno-stack-protector 不生成用于检测缓冲区溢出的代码
- -Os 为减小代码大小而进行优化
- -I
添加搜索头文件的路径
- -fno-builtin 不进行builtin函数的优化
下列代码为生成sign的代码
$(call add_files_host,tools/sign.c,sign,sign)
$(call create_target_host,sign,sign)
下面是生成sign具体的命令:
gcc -Itools/ -g -Wall -O2 -c tools/sign.c -o obj/sign/tools/sign.o
gcc -g -Wall -O2 obj/sign/tools/sign.o -o bin/sign
有了上述的bootasm.o、bootmain.o、sign。
接下来就可以生成bootblock了,实际命令如下:
ld -m elf_i386 -nostdlib -N -e start -Ttext 0x7C00 obj/boot/bootasm.o obj/boot/bootmain.o -o obj/bootblock.o
参数解释如下:(不重复解释)
- -m 模拟为i386上的连接器
- -N 设置代码段和数据段均可读写
- -e 指定入口
- -Ttext 制定代码段开始位置
[练习1.2]
一个被系统认为是符合规范的硬盘主引导扇区的特征有以下几点:
- 磁盘主引导扇区只有512字节
- 磁盘最后两个字节为0x55AA
- 由不超过466字节的启动代码和不超过64字节的硬盘分区表加上两个字节的结束符组成
[练习2]
2.1从 CPU加电后执行的第一条指令开始,单步跟踪 BIOS的执行。
修改 lab1/tools/gdbinit,内容为:
set architecture i8086
target remote :1234
2.在 lab1目录下,执行make debug
执行命令如下图
3.设置单步调试si
4.在gdb界面下,可通过如下命令来看BIOS的代码
x /2i $pc //显示当前eip处的汇编指令
2.2 在初始化位置0x7c00设置实地址断点,测试断点正常
在tools/gdbinit结尾加上
set architecture i8086 //设置当前调试的CPU是8086
b *0x7c00 //在0x7c00处设置断点。此地址是bootloader入口点地址,可看boot/bootasm.S的start地址处
c //continue简称,表示继续执行
x /2i $pc //显示当前eip处的汇编指令
set architecture i386 //设置当前调试的CPU是80386
所以断点正常
[练习3]
分析从bootloader进入保护模式的过程。BIOS 将通过读取硬盘主引导扇区到内存,并转跳到对应内存中的位置执行 bootloader。请分析bootloader是如何完成从实模式进入保护模式的
首先我们先分析一下bootloader:
1、关闭中断,将各个段寄存器重置
它先将各个寄存器置0
cli # Disable interrupts
cld # String operations increment
xorw %ax, %ax # Segment number zero
movw %ax, %ds # -> Data Segment
movw %ax, %es # -> Extra Segment
movw %ax, %ss # -> Stack Segment
2、开启A20
然后就是将A20置1,这里简单解释一下A20,当 A20 地址线控制禁止时,则程序就像在 8086 中运行,1MB 以上的地是不可访问的。而在保护模式下 A20 地址线控制是要打开的,所以需要通过将键盘控制器上的A20线置于高电位,使得全部32条地址线可用。
seta20.1:
inb $0x64, %al # 读取状态寄存器,等待8042键盘控制器闲置
testb $0x2, %al # 判断输入缓存是否为空
jnz seta20.1
movb $0xd1, %al # 0xd1表示写输出端口命令,参数随后通过0x60端口写入
outb %al, $0x64
seta20.2:
inb $0x64, %al
testb $0x2, %al
jnz seta20.2
movb $0xdf, %al # 通过0x60写入数据11011111 即将A20置1
outb %al, $0x60
13、加载GDT表
lgdt gdtdesc
4、将CR0的第0位置1
movl %cr0, %eax
orl $CR0_PE_ON, %eax
movl %eax, %cr0
5、长跳转到32位代码段,重装CS和EIP
ljmp $PROT_MODE_CSEG, $protcseg
6、重装DS、ES等段寄存器等
movw $PROT_MODE_DSEG, %ax # Our data segment selector
movw %ax, %ds # -> DS: Data Segment
movw %ax, %es # -> ES: Extra Segment
movw %ax, %fs # -> FS
movw %ax, %gs # -> GS
movw %ax, %ss # -> SS: Stack Segment
7、转到保护模式完成,进入boot主方法
movl $0x0, %ebp
movl $start, %esp
call bootmain
[练习4]
分析bootloader加载ELF格式的OS的过程
- bootloader如何读取硬盘扇区的?
- bootloader是如何加载 ELF格式的 OS?
这里主要分析是bootmain函数,
bootmain(void) {
readseg((uintptr_t)ELFHDR, SECTSIZE * 8, 0);
if (ELFHDR->e_magic != ELF_MAGIC) {
goto bad;
}
struct proghdr *ph, *eph;
ph = (struct proghdr )((uintptr_t)ELFHDR + ELFHDR->e_phoff);
eph = ph + ELFHDR->e_phnum;
for (; ph < eph; ph ++) {
readseg(ph->p_va & 0xFFFFFF, ph->p_memsz, ph->p_offset);
}
((void ()(void))(ELFHDR->e_entry & 0xFFFFFF))();
bad:
outw(0x8A00, 0x8A00);
outw(0x8A00, 0x8E00);
while (1);
}
bootloader读取硬盘扇区
根据上述bootmain函数分析,首先是由readseg函数读取硬盘扇区,而readseg函数则循环调用了真正读取硬盘扇区的函数readsect来每次读出一个扇区 ,如下,详细的解释看代码中的注释:
readsect(void *dst, uint32_t secno) {
waitdisk(); // 等待硬盘就绪
// 写地址0x1f2~0x1f5,0x1f7,发出读取磁盘的命令
outb(0x1F2, 1);
outb(0x1F3, secno & 0xFF);
outb(0x1F4, (secno >> 8) & 0xFF);
outb(0x1F5, (secno >> 16) & 0xFF);
outb(0x1F6, ((secno >> 24) & 0xF) | 0xE0);
outb(0x1F7, 0x20);
waitdisk();
insl(0x1F0, dst, SECTSIZE / 4);//读取一个扇区
}
bootloader加载 ELF格式的 OS
读取完磁盘之后,开始加载ELF格式的文件。详细的解释看代码中的注释。
bootmain(void) {
…
//首先判断是不是ELF
if (ELFHDR->e_magic != ELF_MAGIC) {
goto bad;
}
struct proghdr *ph, *eph;
//ELF头部有描述ELF文件应加载到内存什么位置的描述表,这里读取出来将之存入ph
ph = (struct proghdr *)((uintptr_t)ELFHDR + ELFHDR->e_phoff);
eph = ph + ELFHDR->e_phnum;
//按照程序头表的描述,将ELF文件中的数据载入内存
for (; ph < eph; ph ++) {
readseg(ph->p_va & 0xFFFFFF, ph->p_memsz, ph->p_offset);
}
//根据ELF头表中的入口信息,找到内核的入口并开始运行
((void (*)(void))(ELFHDR->e_entry & 0xFFFFFF))();
bad:
…
}
[练习5]
完成kdebug.c中函数print_stackframe的实现,可以通过函数>print_stackframe来跟踪函数调用堆栈中记录的返回地址。
1、函数堆栈的原理
理解函数堆栈最重要的两点是:栈的结构,以及EBP寄存器的作用。
一个函数调用动作可分解为零到多个 PUSH指令(用于参数入栈)和一个 CALL 指令。CALL 指令内部其实还暗含了一个将返回地址压栈的动作,这是由硬件完成的。几乎所有本地编译器都会在每个函数体之前插入类似如下的汇编指令:
pushl %ebp
movl %esp,%ebp
这两条汇编指令的含义是:首先将ebp 寄存器入栈,然后将栈顶指针 esp 赋值给 ebp。
movl %esp %ebp这条指令表面上看是用esp覆盖 ebp原来的值,其实不然。因为给 ebp赋值之前,
原ebp 值已经被压栈(位于栈顶),而新的ebp又恰恰指向栈顶。此时ebp寄存器就已经处于一个
非常重要的地位,该寄存器中存储着栈中的一个地址(原 ebp入栈后的栈顶),从该地址为基准,
向上(栈底方向)能获取返回地址、参数值,向下(栈顶方向)能获取函数局部变量值,而该地址
处又存储着上一层函数调用时的ebp值。
函数调用大概包括以下几个步骤:
- 1、参数入栈:将参数从右向左(或从右向左)依次压入系统栈中。
- 2、返回地址入栈:将当前代码区调用指令的下一条指令地址压入栈中,供函数返回时继续执行。
- 3、代码区跳转:处理器从当前代码区跳转到被调用函数的入口处。
- 4、栈帧调整
- 4.1保存当前栈帧状态值,已备后面恢复本栈帧时使用(EBP入栈)。
- 4.2将当前栈帧切换到新栈帧(将ESP值装入EBP,更新栈帧底部)。
- 4.3给新栈帧分配空间(把ESP减去所需空间的大小,抬高栈顶)。
而函数返回大概包括以下几个步骤:
- 1、保存返回值,通常将函数的返回值保存在寄存器EAX中。
- 2、弹出当前帧,恢复上一个栈帧。
- 2.1在堆栈平衡的基础上,给ESP加上栈帧的大小,降低栈顶,回收当前栈帧的空间
- 2.2将当前栈帧底部保存的前栈帧EBP值弹入EBP寄存器,恢复出上一个栈帧。
- 2.3将函数返回地址弹给EIP寄存器。
- 3、跳转:按照函数返回地址跳回母函数中继续执行。
而由此我们可以直接根据ebp就能读取到各个栈帧的地址和值,一般而言,ss:[ebp+4]处为返回地址,ss:[ebp+8]处为第一个参数值(最后一个入栈的参数值,此处假设其占用 4 字节内存,对应32位系统),ss:[ebp-4]处为第一个局部变量,ss:[ebp]处为上一层 ebp 值。
2、print_stackframe函数的实现
首先我们直接看到print_stackframe函数的注释:
void print_stackframe(void) {
/* LAB1 YOUR CODE : STEP 1 /
/ (1) call read_ebp() to get the value of ebp. the type is (uint32_t);
* (2) call read_eip() to get the value of eip. the type is (uint32_t);
* (3) from 0 … STACKFRAME_DEPTH
* (3.1) printf value of ebp, eip
* (3.2) (uint32_t)calling arguments [0…4] = the contents in address (unit32_t)ebp +2 [0…4]
* (3.3) cprintf("\n");
* (3.4) call print_debuginfo(eip-1) to print the C calling function name and line number, etc.
* (3.5) popup a calling stackframe
* NOTICE: the calling funciton’s return addr eip = ss:[ebp+4]
* the calling funciton’s ebp = ss:[ebp]
*/
}
这样我们直接根据注释以及之前的相关知识就能比较简单的编写成程序,如下所示:
void print_stackframe(void) {
uint32_t ebp=read_ebp();//(1) call read_ebp() to get the value of ebp. the type is (uint32_t)
uint32_t eip=read_eip();//(2) call read_eip() to get the value of eip. the type is (uint32_t)
int i;
for(i=0;i<STACKFRAME_DEPTH&&ebp!=0;i++){//(3) from 0 … STACKFRAME_DEPTH
cprintf(“ebp:0x%08x eip:0x%08x “,ebp,eip);//(3.1)printf value of ebp, eip
uint32_t tmp=(uint32_t )ebp+2;
cprintf(“arg :0x%08x 0x%08x 0x%08x 0x%08x”,(tmp+0),(tmp+1),(tmp+2),(tmp+3));//(3.2)(uint32_t)calling arguments [0…4] = the contents in address (unit32_t)ebp +2 [0…4]
cprintf(”\n”);//(3.3) cprintf("\n");
print_debuginfo(eip-1);//(3.4) call print_debuginfo(eip-1) to print the C calling function name and line number, etc.
eip=((uint32_t *)ebp)[1];
ebp=((uint32_t *)ebp)[0];//(3.5) popup a calling stackframe
}
}
实验结果截图如下:
[练习6]
1.中断向量表中一个表项占多少字节?其中哪几位代表中断处理代码的入口?
2.请编程完善kern/trap/trap.c中对中断向量表进行初始化的函数idt_init。在idt_init函数中,依次对所有中断入口进行初始化。使用mmu.h中的SETGATE宏,填充idt数组内容。注意除了系统调用中断(T_SYSCALL)以外,其它中断均使用中断门描述符,权限为内核态权限;而系统调用中断使用异常,权限为陷阱门描述符。每个中断的入口由tools/vectors.c生成,使用trap.c中声明的vectors数组即可。
3.请编程完善trap.c中的中断处理函数trap在对时钟中断进行处理的部分填写trap函数中处理时钟中断的部分,使操作系统每遇到100次时钟中断后,调用 print_ticks子程序,向屏幕上打印一行文字100 ticks。
[练习6.1]
中断描述符表一个表项占8字节。其中015位和4863位分别为offset的低16位和高16位。16~31位为段选择子。通过段选择子获得段基址,加上段内偏移量即可得到中断处理代码的入口。
[练习6.2]
这里这里主要就是实现对中断向量表的初始化。
注释如下:
void idt_init(void) {
/* LAB1 YOUR CODE : STEP 2 /
/ (1) Where are the entry addrs of each Interrupt Service Routine (ISR)?
* All ISR’s entry addrs are stored in __vectors. where is uintptr_t __vectors[] ?
* __vectors[] is in kern/trap/vector.S which is produced by tools/vector.c
* (try “make” command in lab1, then you will find vector.S in kern/trap DIR)
* You can use “extern uintptr_t __vectors[];” to define this extern variable which will be used later.
* (2) Now you should setup the entries of ISR in Interrupt Description Table (IDT).
* Can you see idt[256] in this file? Yes, it’s IDT! you can use SETGATE macro to setup each item of IDT
* (3) After setup the contents of IDT, you will let CPU know where is the IDT by using ‘lidt’ instruction.
* You don’t know the meaning of this instruction? just google it! and check the libs/x86.h to know more.
* Notice: the argument of lidt is idt_pd. try to find it!
*/
}
重点就是两步
第一步,声明__vertors[],其中存放着中断服务程序的入口地址。这个数组生成于vertor.S中。
第二步,填充中断描述符表IDT。
第三部,加载中断描述符表。
对应到代码中如下所示:
void idt_init(void) {
extern uintptr_t __vectors[];//声明__vertors[]
int i;
for(i=0;i<256;i++) {
SETGATE(idt[i],0,GD_KTEXT,__vectors[i],DPL_KERNEL);
}
SETGATE(idt[T_SWITCH_TOK],0,GD_KTEXT,__vectors[T_SWITCH_TOK],DPL_USER);
lidt(&idt_pd);//使用lidt指令加载中断描述符表
}
这里的SETGATE在mmu.h中有定义,
#define SETGATE(gate, istrap, sel, off, dpl)
参数
gate:为相应的idt[]数组内容,处理函数的入口地址
istrap:系统段设置为1,中断门设置为0
sel:段选择子
off:为__vectors[]数组内容
dpl:设置特权级。这里中断都设置为内核级,即第0级
[练习6.3]
这里根据指导书查看函数trap_dispatch,发现print_ticks()子程序已经被实现了,所以我们直接进行判断输出即可,如下:
…
…
case IRQ_OFFSET + IRQ_TIMER:
ticks ++; //每一次时钟信号会使变量ticks加1
if (ticks==TICK_NUM) {//TICK_NUM已经被预定义成了100,每到100便调用print_ticks()函数打印
ticks-=TICK_NUM;
print_ticks();
}
break;
…
…
实现之后截图如下: