Oranges 读书笔记之加载内核

最新推荐文章于 2021-07-05 15:18:17 发布

cielozhang

最新推荐文章于 2021-07-05 15:18:17 发布

阅读量608

点赞数 2

文章标签：读书 descriptor header table 数据结构 search

本文链接：https://blog.csdn.net/cielozhang/article/details/6184949

版权

接我的上一篇博客

当成功跳转到loader时，所有的指挥权就都在loader手中，因为上文boot.bin中我们只实现了寻找，加载并跳入loader,而在操作系统内核执行之前的加载内核，跳入保护模式等步骤都没有完成。可想而知，这些任务都要交给Loader来完成。

一.加载内核

1.认识内核格式elf

elf文件由4个部分组成，分别是ELF header,Program header table,Sections和Section header table，其中只有ELF头的位置是固定的。

ELF的格式大致如下：

而ELF头格式如代码所示：

#define EI_NIDENT 16

typedef struct{ //大小

unsigned char e_ident[EI_NIDENT]; //16 包含用以表示ELF文件的字符及其他

Elf32_Half e_type; //2 文件类型（可执行文件为2）

Elf32_Half e_machine; //2 该程序的体系结构

Elf32_word e_version; //4 文件版本

Elf32_Addr e_entry; //4 程序入口地址

Elf32_Off e_phoff; //4 Program header table在文件的偏移

Elf32_Off e_shoff; // Section header table的偏移

Elf32_word e_flags; // 为0

Elf32_Half e_ehsize; // Elf header大小

Elf32_Half e_phentsize; // Program header table每个条目大小

Elf32_Half e_phnum; // Program header table的条目数

Elf32_Half e_shentsize; // Section header table条目大小

Elf32_Half e_shnum; // Section header table的条目数

Elf32_Half e _shstrndx; // 包含节名称的字符串表是第几个节

}Elf32_Ehdr;

为了完成加载并跳入内核，我们暂时只需要知道以上的e_entry,e_phoff，e_ehsize,e_phentsize,e_phnum

以及Program header 的结构

typedef struct{

Elf32_word p_type; //所描述的段的类型

Elf32_Off p_offset; //段的第一个字节在文件中的偏移

Elf32_Addr p_vaddr; //段的第一个字节在内存中的虚拟地址

Elf32_Addr p_paddr; //为物理地址保留

Elf32_word p_filesz; //段在文件中的长度

Elf32_word p_memsz; //段在内存中的长度

Elf32_word p_flags; //与段相关的标志

Elf32_word p_align; //根据此项值来确定段在文件以及内存中如何对齐

}Elf32_Phdr;

所以Program header描述了一个段的信息，我们把文件加载进内存就靠这些信息。

其他我们先不管。

假设我们已经有一个内核代码kernel.asm,我们用nasm的选项-f elf指定输出文件为elf文件格式。

nasm -f elf -o kernel.o kernel.asm

ld -s kernel.o -o kernel.bin

2.寻找并加载内核

我们把生成的内核拷贝到软盘上，然后修改loader.asm实现在软盘上寻找并加载内核到指定位置。

步骤同上文boot中寻找loader并加载。加载完成后关闭软驱马达，并显示一个字符串，具体代码如下：

org 0100h BaseOfStack equ 0100h BaseOfKernelFile equ 08000h ; KERNEL.BIN 被加载到的位置 ---- 段地址 OffsetOfKernelFile equ 0h ; KERNEL.BIN 被加载到的位置 ---- 偏移地址 jmp LABEL_START ; Start ; 下面是 FAT12 磁盘的头, 之所以包含它是因为下面用到了磁盘的一些信息 %include "fat12hdr.inc" LABEL_START: ; <--- 从这里开始 ************* mov ax, cs mov ds, ax mov es, ax mov ss, ax mov sp, BaseOfStack mov dh, 0 ; "Loading " call DispStr ; 显示字符串 ; 下面在 A 盘的根目录寻找 KERNEL.BIN mov word [wSectorNo], SectorNoOfRootDirectory xor ah, ah ; `. xor dl, dl ; | 软驱复位 int 13h ; / LABEL_SEARCH_IN_ROOT_DIR_BEGIN: cmp word [wRootDirSizeForLoop], 0 ; `. jz LABEL_NO_KERNELBIN ; | 判断根目录区是不是已经读完, dec word [wRootDirSizeForLoop] ; / 读完表示没有找到 KERNEL.BIN mov ax, BaseOfKernelFile mov es, ax ; es <- BaseOfKernelFile mov bx, OffsetOfKernelFile ; bx <- OffsetOfKernelFile mov ax, [wSectorNo] ; ax <- Root Directory 中的某 Sector 号 mov cl, 1 call ReadSector mov si, KernelFileName ; ds:si -> "KERNEL BIN" mov di, OffsetOfKernelFile cld mov dx, 10h LABEL_SEARCH_FOR_KERNELBIN: cmp dx, 0 ; `. jz LABEL_GOTO_NEXT_SECTOR_IN_ROOT_DIR; | 循环次数控制, 如果已经读完 dec dx ; / 了一个 Sector, 就跳到下一个 mov cx, 11 LABEL_CMP_FILENAME: cmp cx, 0 ; `. jz LABEL_FILENAME_FOUND ; | 循环次数控制, 如果比较了 11 个字符都 dec cx ; / 相等, 表示找到 lodsb ; ds:si -> al cmp al, byte [es:di] ; if al == es:di jz LABEL_GO_ON jmp LABEL_DIFFERENT LABEL_GO_ON: inc di jmp LABEL_CMP_FILENAME ; 继续循环 LABEL_DIFFERENT: and di, 0FFE0h ; else`. 让 di 是 20h 的倍数 add di, 20h ; | mov si, KernelFileName ; | di += 20h 下一个目录条目 jmp LABEL_SEARCH_FOR_KERNELBIN; / LABEL_GOTO_NEXT_SECTOR_IN_ROOT_DIR: add word [wSectorNo], 1 jmp LABEL_SEARCH_IN_ROOT_DIR_BEGIN LABEL_NO_KERNELBIN: mov dh, 2 ; "No KERNEL." call DispStr ; 显示字符串 %ifdef _LOADER_DEBUG_ mov ax, 4c00h ; `. int 21h ; / 没有找到 KERNEL.BIN, 回到 DOS %else jmp $ ; 没有找到 KERNEL.BIN, 死循环在这里 %endif LABEL_FILENAME_FOUND: ; 找到 KERNEL.BIN 后便来到这里继续 mov ax, RootDirSectors and di, 0FFF0h ; di -> 当前条目的开始 push eax mov eax, [es : di + 01Ch] ; `. mov dword [dwKernelSize], eax ; / 保存 KERNEL.BIN 文件大小 pop eax add di, 01Ah ; di -> 首 Sector mov cx, word [es:di] push cx ; 保存此 Sector 在 FAT 中的序号 add cx, ax add cx, DeltaSectorNo ; cl <- KERNEL.BIN 的起始扇区号(0-based) mov ax, BaseOfKernelFile mov es, ax ; es <- BaseOfKernelFile mov bx, OffsetOfKernelFile ; bx <- OffsetOfKernelFile mov ax, cx ; ax <- Sector 号 LABEL_GOON_LOADING_FILE: push ax ; `. push bx ; | mov ah, 0Eh ; | 每读一个扇区就在 "Loading " 后面 mov al, '.' ; | 打一个点, 形成这样的效果: mov bl, 0Fh ; | Loading ...... int 10h ; | pop bx ; | pop ax ; / mov cl, 1 call ReadSector pop ax ; 取出此 Sector 在 FAT 中的序号 call GetFATEntry cmp ax, 0FFFh jz LABEL_FILE_LOADED push ax ; 保存 Sector 在 FAT 中的序号 mov dx, RootDirSectors add ax, dx add ax, DeltaSectorNo add bx, [BPB_BytsPerSec] jmp LABEL_GOON_LOADING_FILE LABEL_FILE_LOADED: call KillMotor ; 关闭软驱马达 mov dh, 1 ; "Ready." call DispStr ; 显示字符串 jmp $ ;============================================================================ ;变量 ;---------------------------------------------------------------------------- wRootDirSizeForLoop dw RootDirSectors ; Root Directory 占用的扇区数 wSectorNo dw 0 ; 要读取的扇区号 bOdd db 0 ; 奇数还是偶数 dwKernelSize dd 0 ; KERNEL.BIN 文件大小 ;============================================================================ ;字符串 ;---------------------------------------------------------------------------- KernelFileName db "KERNEL BIN", 0 ; KERNEL.BIN 之文件名 ; 为简化代码, 下面每个字符串的长度均为 MessageLength MessageLength equ 9 LoadMessage: db "Loading " Message1 db "Ready. " Message2 db "No KERNEL" ;============================================================================ ;---------------------------------------------------------------------------- ; 函数名: DispStr ;---------------------------------------------------------------------------- ; 作用: ; 显示一个字符串, 函数开始时 dh 中应该是字符串序号(0-based) DispStr: mov ax, MessageLength mul dh add ax, LoadMessage mov bp, ax ; ┓ mov ax, ds ; ┣ ES:BP = 串地址 mov es, ax ; ┛ mov cx, MessageLength ; CX = 串长度 mov ax, 01301h ; AH = 13, AL = 01h mov bx, 0007h ; 页号为0(BH = 0) 黑底白字(BL = 07h) mov dl, 0 add dh, 3 ; 从第 3 行往下显示 int 10h ; int 10h ret ;---------------------------------------------------------------------------- ; 函数名: ReadSector ;---------------------------------------------------------------------------- ; 作用: ; 从序号(Directory Entry 中的 Sector 号)为 ax 的的 Sector 开始, 将 cl 个 Sector 读入 es:bx 中 ReadSector: ; ----------------------------------------------------------------------- ; 怎样由扇区号求扇区在磁盘中的位置 (扇区号 -> 柱面号, 起始扇区, 磁头号) ; ----------------------------------------------------------------------- ; 设扇区号为 x ; ┌ 柱面号 = y >> 1 ; x ┌ 商 y ┤ ; -------------- => ┤ └ 磁头号 = y & 1 ; 每磁道扇区数 │ ; └ 余 z => 起始扇区号 = z + 1 push bp mov bp, sp sub esp, 2 ; 辟出两个字节的堆栈区域保存要读的扇区数: byte [bp-2] mov byte [bp-2], cl push bx ; 保存 bx mov bl, [BPB_SecPerTrk] ; bl: 除数 div bl ; y 在 al 中, z 在 ah 中 inc ah ; z ++ mov cl, ah ; cl <- 起始扇区号 mov dh, al ; dh <- y shr al, 1 ; y >> 1 (其实是 y/BPB_NumHeads, 这里BPB_NumHeads=2) mov ch, al ; ch <- 柱面号 and dh, 1 ; dh & 1 = 磁头号 pop bx ; 恢复 bx ; 至此, "柱面号, 起始扇区, 磁头号" 全部得到 ^^^^^^^^^^^^^^^^^^^^^^^^ mov dl, [BS_DrvNum] ; 驱动器号 (0 表示 A 盘) .GoOnReading: mov ah, 2 ; 读 mov al, byte [bp-2] ; 读 al 个扇区 int 13h jc .GoOnReading ; 如果读取错误 CF 会被置为 1, 这时就不停地读, 直到正确为止 add esp, 2 pop bp ret ;---------------------------------------------------------------------------- ; 函数名: GetFATEntry ;---------------------------------------------------------------------------- ; 作用: ; 找到序号为 ax 的 Sector 在 FAT 中的条目, 结果放在 ax 中 ; 需要注意的是, 中间需要读 FAT 的扇区到 es:bx 处, 所以函数一开始保存了 es 和 bx GetFATEntry: push es push bx push ax mov ax, BaseOfKernelFile ; ┓ sub ax, 0100h ; ┣ 在 BaseOfKernelFile 后面留出 4K 空间用于存放 FAT mov es, ax ; ┛ pop ax mov byte [bOdd], 0 mov bx, 3 mul bx ; dx:ax = ax * 3 mov bx, 2 div bx ; dx:ax / 2 ==> ax <- 商, dx <- 余数 cmp dx, 0 jz LABEL_EVEN mov byte [bOdd], 1 LABEL_EVEN:;偶数 xor dx, dx ; 现在 ax 中是 FATEntry 在 FAT 中的偏移量. 下面来计算 FATEntry 在哪个扇区中(FAT占用不止一个扇区) mov bx, [BPB_BytsPerSec] div bx ; dx:ax / BPB_BytsPerSec ==> ax <- 商 (FATEntry 所在的扇区相对于 FAT 来说的扇区号) ; dx <- 余数 (FATEntry 在扇区内的偏移)。 push dx mov bx, 0 ; bx <- 0 于是, es:bx = (BaseOfKernelFile - 100):00 = (BaseOfKernelFile - 100) * 10h add ax, SectorNoOfFAT1 ; 此句执行之后的 ax 就是 FATEntry 所在的扇区号 mov cl, 2 call ReadSector ; 读取 FATEntry 所在的扇区, 一次读两个, 避免在边界发生错误, 因为一个 FATEntry 可能跨越两个扇区 pop dx add bx, dx mov ax, [es:bx] cmp byte [bOdd], 1 jnz LABEL_EVEN_2 shr ax, 4 LABEL_EVEN_2: and ax, 0FFFh LABEL_GET_FAT_ENRY_OK: pop bx pop es ret ;---------------------------------------------------------------------------- ;---------------------------------------------------------------------------- ; 函数名: KillMotor ;---------------------------------------------------------------------------- ; 作用: ; 关闭软驱马达 KillMotor: push dx mov dx, 03F2h mov al, 0 out dx, al pop dx ret ;----------------------------------------------------------------------------

二.跳入保护模式

因为一开始CPU是工作在实模式下的，在实模式下CPU为16位，有着16位的寄存器，16位的数据总线及20位的地址总线。只能寻址1MB，所以内存最大也只为1MB。从80386始，intel的CPU开始进入32位，有32位的地址线，可以寻址4GB。

在实模式下CPU寻址是通过段：偏移，段值由16位的CS，DS，SS等寄存器表示。每一个段的最大长度为64K，物理地址的计算遵循以下公式：物理地址＝段值＊10h+偏移。而保护模式下CPU寻址虽然也是段：偏移，不过此时的段已经不是实模式下的段了，尽管它的值也由段寄存器表示。此时它变成了一个索引，指向一个数据结构中的表项。这个数据结构我们称之为GDT

所以为了跳入保护模式，我们需要以下步骤：

1.准备GDT

具体见代码:

; GDT ------------------------------------------------------------------------------------------------------------------------------------------------------------ ; 段基址段界限 , 属性 LABEL_GDT: Descriptor 0, 0, 0 ; 空描述符 LABEL_DESC_FLAT_C: Descriptor 0, 0fffffh, DA_CR | DA_32 | DA_LIMIT_4K ; 0 ~ 4G LABEL_DESC_FLAT_RW: Descriptor 0, 0fffffh, DA_DRW | DA_32 | DA_LIMIT_4K ; 0 ~ 4G LABEL_DESC_VIDEO: Descriptor 0B8000h, 0ffffh, DA_DRW | DA_DPL3 ; 显存首地址 ; GDT ------------------------------------------------------------------------------------------------------------------------------------------------------------ GdtLen equ $ - LABEL_GDT GdtPtr dw GdtLen - 1 ; 段界限 dd BaseOfLoaderPhyAddr + LABEL_GDT ; 基地址 ; GDT 选择子 ---------------------------------------------------------------------------------- SelectorFlatC equ LABEL_DESC_FLAT_C - LABEL_GDT SelectorFlatRW equ LABEL_DESC_FLAT_RW - LABEL_GDT SelectorVideo equ LABEL_DESC_VIDEO - LABEL_GDT + SA_RPL3 ; GDT 选择子 ----------------------------------------------------------------------------------

初看感觉GDT是一个结构数组，数组的每一个元素就是类型为Descriptor的段，以上代码初始化了段的基址，界限及属性。

Descriptor的定义如下：

; 描述符 ; usage: Descriptor Base, Limit, Attr ; Base: dd ; Limit: dd (low 20 bits available) ; Attr: dw (lower 4 bits of higher byte are always 0) %macro Descriptor 3 dw %2 & 0FFFFh ; 段界限 1 (2 字节) dw %1 & 0FFFFh ; 段基址 1 (2 字节) db (%1 >> 16) & 0FFh ; 段基址 2 (1 字节) dw ((%2 >> 8) & 0F00h) | (%3 & 0F0FFh) ; 属性 1 + 段界限 2 + 属性 2 (2 字节) db (%1 >> 24) & 0FFh ; 段基址 3 (1 字节) %endmacro ; 共 8 字节

可以看出Descriptor是一个宏

代码段和数据段描述符的具体结构如下：

现在看GDT表中各描述符的属性，分别有DA_CR,DA_DRW,DA_32,DA_LIMIT_4K,DA_DPL3.

DA_CR=9Ah,存在的可执行可读代码段；DA_DRW=92h,存在的可读写数据段；DA_LIMIT_4K,段界限粒度为4k;DA_DPL3=60h,特权值为3

而GdtLen是整个GDT表的长度，GdtPtr也是一个数据结构，前2个字节为GDT长度，后4个字节为GDT表的基址。

以Selector开头的称为选择子，看上去好像是段在GDT中的索引。CPU寻址的时候就是靠这个从GDT表中得到段的信息，从而正确寻址。Selector存储在CS，DS，ES等段寄存器中，类似于实模式下的段基址。

最后通过一个命令：lgdt [GdtPtr];加载GdtPtr的值到CPU的gdtr寄存器。该寄存器的结构与GdtPtr完全相同。

2.将CPU的工作状态转换为实模式

首先关中断，因为实模式下中断处理机制和保护模式下不同，然后打开A20地址线，通过操作端口92h，最后将cr0寄存器的第零位置为1，该位为1时，cpu运行于保护模式下。

实现代码如下

; 关中断 cli ; 打开地址线A20 in al, 92h or al, 00000010b out 92h, al ; 准备切换到保护模式 mov eax, cr0 or eax, 1 mov cr0, eax

3.从实模式跳入保护模式

跳转只需要一句代码： jmp dword SelectorFlatC:(PM_START)

因为该跳转是在实模式下，而目的地址是在保护模式下，如果偏移超过64K，则可能被截断，所以在前面加dword

三.打开分页机制

分页机制就像一个函数，将物理地址映射为线性地址，那么如何映射呢？我相信看了下面的图就明白了：

在80386中每一个页的大小是4096字节，转换使用2级页表，每个表项4字节长，所以一个页表中最多有1024个表项。进行转换时，先从寄存器cr3指定的页目录中根据线性地址的高10位得到页表地址，再根据线性地址第12到21位得到物理页地址，最后根据低12位加上物理页首地址得到物理地址。

分页机制生效与否还取决于寄存器cr0的第31位称为PG位是否为1，若为1，则分页机制启动。关键代码如下：

SetupPaging: ; 为简化处理, 所有线性地址对应相等的物理地址. ; 首先初始化页目录 mov ax, SelectorPageDir ; 此段首地址为 PageDirBase mov es, ax mov ecx, 1024 ; 共 1K 个表项 xor edi, edi xor eax, eax mov eax, PageTblBase | PG_P | PG_USU | PG_RWW .1: stosd add eax, 4096 ; 为了简化, 所有页表在内存中是连续的. loop .1 ; 再初始化所有页表 (1K 个, 4M 内存空间) mov ax, SelectorPageTbl ; 此段首地址为 PageTblBase mov es, ax mov ecx, 1024 * 1024 ; 共 1M 个页表项, 也即有 1M 个页 xor edi, edi xor eax, eax mov eax, PG_P | PG_USU | PG_RWW .2: stosd add eax, 4096 ; 每一页指向 4K 的空间 loop .2 mov eax, PageDirBase mov cr3, eax mov eax, cr0 or eax, 80000000h mov cr0, eax jmp short .3 .3: nop ret ; 分页机制启动完毕 ----------------------------------------------------------

以上的程序实现了最简单的映射，将线性地址映射成相同的物理地址，若要映射成不同的物理地址，可以修改初始化页表时该页表指向的物理页地址。

四.重新放置内核并跳入内核

我们的内核已经被加载到内存中，但是我们并不能直接跳转到内核开始处执行，我们得重新放置我们的内核。

为了使内核放在指定的地址，在生成elf文件时就要带上参数，-s -Ttext 0x30400将程序入口地址变成30400，关键实现代码如下：; InitKernel --------------------------------------------------------------------------------- ; 将 KERNEL.BIN 的内容经过整理对齐后放到新的位置 ; 遍历每一个 Program Header，根据 Program Header 中的信息来确定把什么放进内存，放到什么位置，以及放多少。 ; -------------------------------------------------------------------------------------------- InitKernel: xor esi, esi mov cx, word [BaseOfKernelFilePhyAddr+2Ch];`. ecx <- pELFHdr->e_phnum movzx ecx, cx ;/ mov esi, [BaseOfKernelFilePhyAddr + 1Ch] ; esi <- pELFHdr->e_phoff add esi, BaseOfKernelFilePhyAddr;esi<-OffsetOfKernel+pELFHdr->e_phoff .Begin: mov eax, [esi + 0] cmp eax, 0 ; PT_NULL jz .NoAction push dword [esi + 010h] ;size ;`. mov eax, [esi + 04h] ; | add eax, BaseOfKernelFilePhyAddr; | memcpy((void*)(pPHdr->p_vaddr), push eax ;src ; | uchCode + pPHdr->p_offset, push dword [esi + 08h] ;dst ; | pPHdr->p_filesz; call MemCpy ; | add esp, 12 ;/ .NoAction: add esi, 020h ; esi += pELFHdr->e_phentsize dec ecx jnz .Begin ret ; InitKernel ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^

根据elf文件的elf头和程序头表中的信息将内核复制到指定地址，最后跳转到该地址处，内核真正开始执行。

cielozhang

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
Oranges 读书笔记之加载内核

 接我的上一篇博客 当成功跳转到loader时，所有的指挥权就都在loader手中，因为上文boot.bin中我们只实现了寻找，加载并跳入loader,而在操作系统内核执行之前的加载内核，跳入保护模式等步骤都没有完成。可想而知，这些任务都要交给Loader来完成。 一.加载内核 1.认识内核格式elf elf文件由4个部分组成，分别是ELF header,Program header table,Section
复制链接

扫一扫