part1：PC Bootstrap

__壁炉__

已于 2024-09-16 11:05:11 修改

阅读量1k

点赞数 17

分类专栏： 6.828 文章标签： bootstrap linux

于 2024-09-16 11:02:18 首次发布

本文链接：https://blog.csdn.net/djsjdh/article/details/142300112

版权

6.828 专栏收录该内容

7 篇文章 0 订阅

订阅专栏

part1：PC Bootstrap

QUESTIONS

Q1：16-bit如何寻址1MB内存

The first PCs, which were based on the 16-bit Intel 8088 processor, were only capable of addressing 1MB of physical memory.

联系到汇编语言中的CS，SS等寄存器。对于16bit寄存器可以寻址64KB地址，所以8086将内存分为64KB的逻辑段，再通过段偏移的手段，得到最终的地址。

cpu通过DS先找到相应的逻辑段（数据段），接着根据段内指针找到响应单元；对于堆栈同理，即SS + SP获取。

对应于，汇编语言中

MOV AX,0B800H
MOV DS,AX #内存地址0xB8000 - 0xBFFFFF

这样就访问到了1MB的内存

Q2：ROM BIOS is doing what?

0xfcf71: mov    $0x8f,%ax
0xfcf77: out    %al,$0x70
0xfcf79: in     $0x71,%al
0xfcf7b: in     $0x92,%al
0xfcf7d: or     $0x2,%al
0xfcf7f: out    %al,$0x92

这里应该是通过I/O控制需要初始化的芯片（或者外设）

所以BIOS（Basic I/O System），对最底层的设备进行输入输出控制

NOTES

1、[f000:fff0] 0xffff0: ljmp $0xf000,$0xe05b

The IBM PC starts executing at physical address 0x000ffff0, which is at the very top of the 64KB area reserved for the ROM BIOS.
The PC starts executing with CS = 0xf000 and IP = 0xfff0.
The first instruction to be executed is a jmp instruction, which jumps to the segmented address CS = 0xf000 and IP = 0xe05b.

在我的机器上jump 到CS = 0x3630 IP=$0xf000e05b

2、Physical Address Space

请添加图片描述

结合上面发现，启动之后，BIOS将程序（CS:IP）跳转到距离他16个字节的位置（0xffff0)

part2: The Boot Loader

QUESTIONS

Q1、At what point does the processor start executing 32-bit code? What exactly causes the switch from 16- to 32-bit mode?

.set CR0_PE_ON,      0x1         # protected mode enable flag 设置变量

# Jump to next instruction, but in 32-bit code segment.
# Switches processor into 32-bit mode.

ljmp    $PROT_MODE_CSEG, $protcseg
.code32				    #告诉汇编器，接下来要生成32位的机器码
	--------

Q2、What is the last instruction of the boot loader executed, and what is the first instruction of the kernel it just loaded?

bootloader由两部分组成，一个是boot.s，一个是bootmain.c其中最后执行的是在c文件中的（这里可以对照反汇编代码obj/boot/boot.asm）

// call the entry point from the ELF header
// note: does not return!
((void (*)(void)) (ELFHDR->e_entry))();
7d81:	ff 15 18 00 01 00    	call   *0x10018

即跳转到操作系统内核程序的起始指令处。

内核加载到内存中执行的第一句是

Q3、How does the boot loader decide how many sectors it must read in order to fetch the entire kernel from disk? Where does it find this information?

首先关于操作系统一共有多少个段，每个段又有多少个扇区的信息位于操作系统文件中的Program Header Table中。这个表中的每个表项分别对应操作系统的一个段。并且每个表项的内容包括这个段的大小，段起始地址偏移等等信息。所以如果我们能够找到这个表，那么就能够通过表项所提供的信息来确定内核占用多少个扇区。
　　　那么关于这个表存放在哪里的信息，则是存放在操作系统内核映像文件的ELF头部信息中。

void
readseg(uint32_t pa, uint32_t count, uint32_t offset)

函数从硬盘offset指定的位置开始，读取count字节的数据，到内存中pa位置。在bootmain中调用形式为readseg((uint32_t) ELFHDR, SECTSIZE*8, 0)，可见是从硬盘的最开头读取了8个SECTSIZE这么多的内容到内存中制定位置ELFHDR。其中，ELFHDR指定为0x10000，是内核的开头，正如反汇编文件obj/kern/kernel.asm的第一个指令换算前的地址正是0x10000。读取了8个区块，区块大小SECTSIZE指定为512，则总大小为8 * 512 = 4096，这是一个page的大小。

读取进来的是一个镜像，也就是ELF文件的部分内容。之所以是部分，是因为我们还不知道整个内核的大小，但是这里读取进来的信息至少包含了文件头，真正的读取还要根据文件头中包含的信息执行。

（The program header table tells the system how to create a process image. It is found at file offset e_phoff, and consists of e_phnum entries, each with size e_phentsize. The layout is slightly different in 32-bit ELF vs 64-bit ELF, because the p_flags are in a different structure location for alignment reasons. ）来自wiki。

Q4、Exercise 5. 将原链接地址0x7c00修改后会发生什么

这里先按照lab中的词汇以个人理解区分一下两个地址——link address和load address。对于这两个地址，lab中用了ELF中的VMA(link address)和LMA来说明。所以说link address相当于一种相对地址，是虚拟内存中所用到的基地址。

对于这里的0x7c00，lab中有说明，8086通过硬布线来实现，无论如何改装载地址不会变化。所以说，修改了boot中的makefrag并不影响bootloader的装载。而修改后，此处的link address实际上是发生变化的，所以说基地址会发生变化，就导致内部在执行跳转或者符号表的调用时，就会发生问题。

从代码角度来看，会跟明白。我们先修改boot/Makefrag中的0x7c00(这里我修改为了0x7000)，之后我们再回到lab目录下

make clean
make

#如下输出就是重新编译完成了
+ as kern/entry.S
+ cc kern/entrypgdir.c
+ cc kern/init.c
+ cc kern/console.c
+ cc kern/monitor.c
+ cc kern/printf.c
+ cc kern/kdebug.c
+ cc lib/printfmt.c
+ cc lib/readline.c
+ cc lib/string.c
+ ld obj/kern/kernel
ld: warning: section `.bss' type changed to PROGBITS
+ as boot/boot.S
+ cc -Os boot/main.c
+ ld boot/boot
boot block is 412 bytes (max 510)
+ mk obj/kern/kernel.img

之后，我们再来看看bootloader的ELF头里面的VMA和LMA（这里的二者是一样的，原因应该是因为暂时没有操作系统的进入，所以没有虚拟内存（但是VMA仍看作是link address））（可以联想实模式和保护模式）

objdump -h obj/boot/boot.out

Idx Name          Size      VMA       LMA       File off  Algn
  0 .text         0000019c  00007000  00007000  00000074  2**2

得到了这样的结果，发现，我们的VMA确实被修改了

之后我们调试内核，可以发现bios仍然会跳转到0x7c00，原因上面我们说了（硬布线），之后真正出错，也就是因为VMA发生改动，导致无法跳转到正确的地址。

NOTES

1、protect mode And real mode

对于real mode，内存大小很有限即1MB（对于为什么16bit可以寻址1MB在Q1中说明，这里对DS，CS等的‘S’翻译为selector）。

这里导致一个问题的出现，一个selector还是只能访问64K的内存，所以要求将程序分为64K的小块；当然不止是程序段CS，还包括数据段DS，在面临大数据段时，将非常awkward。
protect mode分为16位和32位的（现在应该也有64位的）。

在保护模式下，主要的思想是通过虚拟内存来进行内存的控制。并且可以访问到1MB以上的空间（也就是全部的硬件功能）

对于16位保护模式的情况来说，在实模式中出现的段问题还是仍然存在。不过在32-bit的情况下，就可以得到解决，因为他的一个段可以有4GB，同时可以分的更小，进而有了4KB的页表。可以联想到段页储存法

2、((void (*)(void)) (ELFHDR->e_entry))();

先对e_entry进行简单说明，这是ELF中保存的程序入口地址，指示了程序从何处开始执行。虽然是入口地址，但是它并不在0x00100000执行（bootloader加载的地址），在kern/entry.s中有这样一句话

	# We haven't set up virtual memory yet, so we're running from
	# the physical address the boot loader loaded the kernel at: 1MB
	# (plus a few bytes).

也即，入口地址在加载地址稍微偏后一点的位置

ELFHDR->e_entry：
- ELFHDR 是一个指向 ELF（Executable and Linkable Format）头部的结构体指针。e_entry 是这个结构体中的一个成员，通常表示程序入口点的地址（即程序开始执行的位置）。
(void (\*)(void))：
- 这是一个类型转换，将 e_entry 的地址转换为一个函数指针。具体来说，这里将其转换为一个返回类型为 void 且不接受任何参数的函数指针。
- void (*)(void) 表示一个指向返回类型为 void 的函数的指针，且这个函数不接受任何参数。
((void (\*)(void)) (ELFHDR->e_entry))：
- 这部分将 e_entry 中的地址转换为函数指针后，即获得了一个可以调用的函数指针。
();：
- 这部分表示调用刚刚转换得到的函数指针。由于函数不接受任何参数，因此括号是空的。

3、ELF

header：

.bss: 未初始化的全局变量
.text: 程序指令
.rodata: 只读数据，如字符串常量，const修饰的变量等
.data: 初始化的全局变量

VMA，LMA

其中VMA为虚拟内存地址（link address），它确定程序在最终可执行文件中的位置，在程序符号表中记录。

LMA（load memory address），程序最终装载的位置。

所以说，程序最终执行的位置为LMA。可以理解为VMA为逻辑地址，而LMA是实际物理地址

part3、The Kernel

Exercise7. 查看映射完成前后的内存变化

请添加图片描述

可以发现映射前，内存内容不同
请添加图片描述

映射后，0xf0100000的内容已相同。

What is the first instruction after the new mapping is established that would fail to work properly if the mapping weren’t in place? Comment out the movl %eax, %cr0 in kern/entry.S, trace into it, and see if you were right.

这里我猜测是68行的代码jmp *%eax，原因和之前修改bootloader的link address0x7c00的想法一样，映射基地址发生了变化，将导致这句指令指向一个空指针。

Exercise8. 补全打印八进制的代码

(这里推荐使用vscode，因为可以直接go to definition)我们顺着print(就是cprintf)一步步找下去发现它逐次调用了vcprintf vprintfmt，发现在函数内处理fmt格式化字符，向下可以找到o，也就是要求补全的代码，这里仿照%u进行修改就可以

case 'o':
     num = getint(&ap, lflag);
     base = 8;
     goto number;
-----最后都会跳到230行的number处打印--------
number:
	printnum(putch, putdat, num, base, width, padc);
	break;

------最后在printnum中递归实现逆序打印--------
/*
 * Print a number (base <= 16) in reverse order,
 * using specified putch function and associated pointer putdat.
 */
static void
printnum(void (*putch)(int, void*), void *putdat,
	 unsigned long long num, unsigned base, int width, int padc)
{
	// first recursively print all preceding (more significant) digits
	if (num >= base) {
		printnum(putch, putdat, num / base, base, width - 1, padc);
	} else {
		// print any needed pad characters before first digit
		while (--width > 0)
			putch(padc, putdat);
	}

	// then print this (the least significant) digit
	putch("0123456789abcdef"[num % base], putdat);
}

可以重新编译调试，查看发现

6828 decimal is XXX octal!

变成

6828 decimal is 15254 octal!

说明我们结果是正确的

Q1、printf.c与console.c之间的接口问题

printf.c中使用了cputchar()函数，而console.c中也会使用cprintf()，打印信息到终端上。

Q2、解释下面代码

      if (crt_pos >= CRT_SIZE) {
              int i;
              memmove(crt_buf, crt_buf + CRT_COLS, (CRT_SIZE - CRT_COLS) * sizeof(uint16_t));
              for (i = CRT_SIZE - CRT_COLS; i < CRT_SIZE; i++)
                      crt_buf[i] = 0x0700 | ' ';
              crt_pos -= CRT_COLS;
      }

这里向上翻看crt_pos保存的是光标的位置。CRT_COLS和CRT_SIZE等是宏，表示显示器一行的字长和总共最大容纳的字数

memmove是标准库函数void *memmove(void *dest, const void *src, size_t n);表示以src为源地址，向dest方向移动，移动单位为n个字节。在这里，也就是向首地址移动。

所以综合起来看，主要功能就是当光标指到最后一行的时候（屏幕满时），将文字向上移动一行。最后的for循环是，将新行用0x0700 | ' '填充(应该是颜色色块)，之后再将光标向上移动一行。完成总体的移动。

Q3、cprintf(“x=%d y=%d”, 3);会得到什么

这里我们看到cprintf是没有做异常处理的，所以，要从va_arg源码的角度考虑

#define va_arg(ap, type) \
    (ap += sizeof(type), *((type *)(ap - sizeof(type))))

从上面我们可以看到，va_arg其实就是对ap的地址进行操作，也就是将它向右加一个单位来移动ap；返回逗号表达式的右项，也就是加完之后，后退一个单位得到这个地址中的结果。

所以这里分析，对于上述的输出，主要要看在这个，3之后跟着的下一个（int*）内存中储存的是什么。

这里我们也可以直接调试源代码得到

---在函数i386_init处打上断点，然后调试就可以----
b i386_init

Q4、如果改变GCC的调用时的压栈顺序要怎么改变cprintf()的使用

使用时倒着输参数
更改ap的增长顺序（涉及修改标准库了，可以用函数打桩）

Exercise9、内核初始化栈相关

从entry.S中可以找到这样几句话
```
# Set the stack pointer
	movl	$(bootstacktop),%esp
```
这里将bootstacktop的地址传入esp，也即栈指针（bootstacktop可以在.data区中找到）
我们也可以调试查看bootstacktop或者esp的值
```
(gdb) print $esp
$1 = (void *) 0xf0110000 <entry_pgtable>
```
从kernel.asm反汇编文件中，可以看到，和我们调试得到的结果是一样的，所以可以确定，栈顶指针初始化时，指向0xf0110000（当然是虚拟地址，物理地址减去偏移量0xf0000000）
```
	movl	$(bootstacktop),%esp
f0100034:	bc 00 00 11 f0       	mov    $0xf0110000,%esp
```
*Everything below that location in the region reserved for the stack is free.*可以知道，栈顶向下增长

Exercise10、调用test_trace的过程

仍然通过调试来查看

----打上断点
(gdb) b test_backtrace
Breakpoint 3 at 0xf0100040: file kern/init.c, line 13.
------向下执行
(gdb) si
=> 0xf0100044 <test_backtrace+4>:	push   %ebp
0xf0100044	13	{
(gdb) si
=> 0xf0100045 <test_backtrace+5>:	mov    %esp,%ebp
0xf0100045 in test_backtrace (x=-267386628) at kern/init.c:13
13	{
(gdb) print $ebp
$4 = (void *) 0xf010fff8
(gdb) print $esp
$5 = (void *) 0xf010ffd8

可以看到，这里堆栈指针和ebp的值

我们也可以使用info stack来查看调用关系。结合上面我们得到的ebp的值来看，可以看到ebp的值等于下面函数调用栈中的test_backtrace的bootstack()的地址，所以ebp保存了函数栈中的最底层（向下生长，所以是最底层）的地址

(gdb) info stack
#0  0xf0100045 in test_backtrace (x=-267386628) at kern/init.c:13
#1  0xf010fff8 in bootstack ()
#2  0xf01000fc in i386_init () at kern/init.c:39
#3  0x00000005 in ?? ()
#4  0xf010003e in relocated () at kern/entry.S:80

查看esp向下的50个空间（下面只选取重要的部分）

可以看到，在0xf010fff8处存有test_backtrace(5)的返回地址0xf010003e

(gdb) x/50x $esp
0xf010ffd8:	0xf010fff8	0xf01000fc	0x00000005	0x00001aac
0xf010ffe8:	0x00000640	0x00000000	0x00000000	0x00010094
0xf010fff8:	0x00000000	0xf010003e	0x00000003	0x00001003

Exercise11、stackTrace实现

int
mon_backtrace(int argc, char **argv, struct Trapframe *tf)
{
	// Your code here.
	//use the sentence directly,to get ebp, otherwise use read_ebp()
	//asm volatile("movl %%ebp,%0" : "=r" (ebp));
	uint32_t* ebp = (uint32_t*)read_ebp();
	//one ebp will show a 32bit,so convert to uint_32t*
	cprintf("Stack backtrace:\r\n");
	while(ebp){
		//as the stack descend, the args was be pushed,so the first five will just after(on) the eip
		cprintf("  ebp %08x  eip %08x  args %08x %08x %08x %08x %08x\r\n",ebp,ebp[1],ebp[2],ebp[3],ebp[4],ebp[5],ebp[6]);
		ebp = (uint32_t*)*ebp;
	}
	return 0;
}

这里通过获取到的ebp向上（栈向下生长）获取到之前压栈进入的返回地址和传入的参数

这里我们重新来看一下函数的调用：

函数被调用时，操作系统会分给其一个栈帧（类似于一个内存区），这个栈帧的底地址（其实应该是在内存的上方）需要一个变量来记录他，当然这里就不是变量了，就是寄存器——ebp了。所以通过ebp就可以访问到栈帧中的其他位置。

更详细的说，ebp作为当前栈帧的地址，而地址中保存的则是上一个栈帧的地址，所以最后可以通过ebp=*ebp的方式来访问到上一个栈帧。

这里可以参考一下，ebp和esp的关系即函数在调用时都做了什么来加深理解

在函数调用过程中，EBP（基指针寄存器）用于保存当前函数的栈帧信息。其变化过程通常包括以下几个步骤：

保存旧的基指针：
- 当一个函数被调用时，首先会将当前的 EBP 值保存到栈中（也就是调用者函数的EBP）。这是通过 PUSH EBP 指令完成的，目的是为了在函数返回时能够恢复调用函数的栈帧。
设置新的基指针：
- 接下来，新的栈框架会被建立。这时，新的 EBP 值会被设置为当前的栈顶指针 ESP。使用 MOV EBP, ESP 指令将 ESP 的值拷贝到 EBP 中。
分配局部变量空间：
- 函数可以在其栈帧中分配空间用于局部变量，这通常通过调整 ESP 的值来完成。例如，使用 SUB ESP, n 来为局部变量分配 n 字节的空间。
函数执行：
- 函数的代码执行，期间可以通过 EBP 来访问参数和局部变量。参数通常通过 EBP + offset 来访问，而局部变量则通过 EBP - offset 来访问。
恢复旧的基指针：
- 在函数结束时，首先会恢复 EBP 的旧值。这是通过 MOV ESP, EBP 和 POP EBP 指令完成的，以确保返回到调用函数的栈帧。
返回：
- 最后，使用 RET 指令返回到调用位置。

以上内容来自gpt。

Exercise12、提取符号表并打印

static void
stab_binsearch(const struct Stab *stabs, int *region_left, int *region_right,
	       int type, uintptr_t addr)

先对我们要用到的函数做一些解释，这个函数主要功能一句话说完就是：在stab条目中从left到right的左闭右开区间内查找type为‘type’，地址为addr的条目，结果通过left和right带出。

下面开始看题目

对于获取文件名和函数名的函数，都已经写好。下面让我们完成的就是获取行号

查看inc/stab.h可以知道我们要的应该是这样一条text（指令段）的行号

#define	N_SLINE		0x44	// text segment line number

可以看到，这里已经是对我们的lline，rline初始化完成了，下面我们只要负责用函数找就可以了。

//152行起
if (lfun <= rfun) {
		// stabs[lfun] points to the function name
		// in the string table, but check bounds just in case.
		if (stabs[lfun].n_strx < stabstr_end - stabstr)
			info->eip_fn_name = stabstr + stabs[lfun].n_strx;
		info->eip_fn_addr = stabs[lfun].n_value;
		addr -= info->eip_fn_addr;
		// Search within the function definition for the line number.
		lline = lfun;
		rline = rfun;
	} else {
		// Couldn't find function stab!  Maybe we're in an assembly
		// file.  Search the whole file for the line number.
		info->eip_fn_addr = addr;
		lline = lfile;
		rline = rfile;
	}

	stab_binsearch(stabs, &lline, &rline, N_SLINE, addr);
	if (lline<=rline)
	{
		info->eip_line = stabs[lline].n_desc;
	}
	else
	{
		info->eip_line = 0;
		return -1;
	}

上面使用提供的函数找到lline和rline，如果找到了，取他的n_desc域，也即为行号

到这里，info这个结构体就算是填充完成了。然后就可以修改打印信息了

int
mon_backtrace(int argc, char **argv, struct Trapframe *tf)
{
	// Your code here.
	//use the sentence directly,to get ebp, otherwise use read_ebp()
	//asm volatile("movl %%ebp,%0" : "=r" (ebp));
	uint32_t* ebp = (uint32_t*)read_ebp();
	uint32_t eip = ebp[1];
	//one ebp will show a 32bit,so convert to uint_32t*

	cprintf("Stack backtrace:\r\n");

	while(ebp){
		//as the stack descend, the args was be pushed,so the first five will just after(on) the eip
		cprintf("  ebp %08x  eip %08x  args %08x %08x %08x %08x %08x\r\n",ebp,eip,ebp[2],ebp[3],ebp[4],ebp[5],ebp[6]);
		
		struct Eipdebuginfo info;
		if (debuginfo_eip(eip,&info) == -1){
			cprintf("can't find the info about this addr:%08x\r\n",eip);
			return 0;
		}

		cprintf("    %s:%d: %.*s+%d\r\n",info.eip_file, info.eip_line, info.eip_fn_namelen, info.eip_fn_name, eip-info.eip_fn_addr);

		ebp = (uint32_t*)*ebp;
		eip = ebp[1];
	}


	return 0;
}

这里，每次循环中都要得到eip的值，进而得到info结构体。这样之后，mon_backtrace函数就完成了，现在运行，就可以得到输出结果了。

最后将它作为cmd加入，在commands结构体中添加

static struct Command commands[] = {
	{ "help", "Display this list of commands", mon_help },
	{ "kerninfo", "Display information about the kernel", mon_kerninfo },
	{ "backtrace", "Trace back call stack", mon_backtrace },
};