通过GRUB Multiboot2引导自制操作系统

通过GRUB Multiboot2引导自制操作系统

前言

之前花了一周时间,从头学习了传统 BIOS 的启动流程。惊讶于背后丰富的技术细节的同时,也感叹 x86 架构那厚重的历史包袱。毕竟,谁能想到,一个现代 CPU 竟然需要通过操作“键盘控制器寄存器”来启用一条地址线呢。

最终,出于兼容性和功能性的考虑,我还是决定投入 GRUB 的怀抱。况且,让自己写的操作系统和本机的 Linux 一同出现在 GRUB 菜单中并成功引导启动,也是一件非常有成就感的事。

完整代码在附录部分

开发环境

项目版本
系统Windows Subsystem for Linux - Arch (2.3.24)
编译器gcc version 14.2.1 20240910 (GCC)
引导程序grub-install (GRUB) 2:2.12-3
虚拟机QEMU emulator version 9.1.50 / VirtualBox 7.0.6

1 Multiboot2 规范

想让 GRUB 识别并引导我们自制的操作系统,就得先了解 Multiboot2 规范。

官方文档:Multiboot2 Specification version 2.0

1.1 Multiboot2 header

An OS image must contain an additional header called Multiboot2 header, besides the headers of the format used by the OS image. The Multiboot2 header must be contained completely within the first 32768 bytes of the OS image, and must be 64-bit aligned. In general, it should come as early as possible, and may be embedded in the beginning of the text segment after the real executable header.

这段话的大致意思是:

在 Multiboot2 规范中,操作系统镜像的前 32768 字节内,必须包含一个名为 Multiboot2 header 的数据结构,并且起始地址必须 64-bit 对齐。

Multiboot2 header 的具体结构如下:

OffsetTypeField Name
0u32magic
4u32architecture
8u32header_length
12u32checksum
16-XXtags
1.1.1 Magic fields

Multiboot2 header 的前四个字段,也就是0~15字节的内容,被称为 magic fields

magic 字段是 Multiboot2 header 的识别标志,它必须是十六进制值 0xE85250D6

architecture 字段指定 CPU 的架构。0 表示 i386 的 32 位保护模式,4 表示 32 位 MIPS 架构

header_length 字段记录了 Multiboot2 header 的长度(以字节为单位)

checksum 字段是一个 32 位无符号数,当它与 magic fields 其他字段(即 magicarchitectureheader_length )相加时,其 32 位无符号和必须为零。

1.1.2 Tags

Tags 由一个接一个的 tag 结构体组成,在必要时进行填充,以确保每个 tag 都从 8 字节对齐的地址开始。Tags 以一个 type = 0 且 size = 8 的 tag 作为结束标志(相当于字符串结尾的'\0')。

值得注意的是,官方文档给出的 boot.S 代码并 没有 给 tag 的地址进行 8 字节对齐。这会导致 GRUB 读取 tag 时出现错位,出现各种奇怪的错误(比如 error: unsupported tag: xxx)

每个 tag 都有如下基本结构:

none
   
           +-------------------+

   
   u16     | type              |

   
   u16     | flags             |

   
   u32     | size              |

   
           +-------------------+

type 用于表示 tag 的类型,因为不同的 tag 在 size 之后可能还会有其他数据字段。

如果flags 的第 0 位(也称为 optional)为 1,表示如果引导加载程序缺乏相关支持,它可以忽略这个 tag。

size 表示整个 tag 的长度。

例如,表示程序入口地址的 entry address tag 结构如下:

none
   
           +-------------------+

   
   u16     | type = 3          |

   
   u16     | flags             |

   
   u32     | size              |

   
   u32     | entry_addr        |

   
           +-------------------+

GRUB 会根据 type = 3 判断它是 entry address tag,并在准备工作完成后,跳转到 entry_addr 字段中的地址运行操作系统。

除此之外,还有专门在 EFI 引导使用的 EFI i386 entry address tag

none
   
           +-------------------+

   
   u16     | type = 8          |

   
   u16     | flags             |

   
   u32     | size              |

   
   u32     | entry_addr        |

   
           +-------------------+

其结构与 entry address tag 相同,只是 type = 8 。既然都是指定程序入口,那么二者同时存在时会发生什么呢?

在使用 EFI 引导的情况下,entry address tag 将被忽略,引导加载程序会跳转到 EFI i386 entry address tag 提供的地址。

而使用传统 BIOS 引导时,引导加载程序会直接报错 error: unsupported tag: 0x08 。这是因为传统引导方式不支持 EFI 相关的 tag ,此时 flags 就派上用场了。只要把 flags 最低位设为 1 ,就可以让引导程序在不兼容时忽略这个 tag,而在 EFI 引导时又能正常使用它。

如此一来,我们的启动程序就能够兼容多种启动方式。

除此之外的 tag 类型,可以在 Multiboot2 Specification version 2.0 的 3.1.3 ~ 3.1.13 节找到详细说明。

1.2 机器状态

官方文档中的 3.3 I386 machine state 说明了引导加载程序调用 32 位操作系统时的机器状态。

除了开启保护模式和启用 A20 gate 这些常规操作以外,还有两条比较重要的内容:

  1. EAX 必须包含标识值 0x36d76289,该值的存在向操作系统表明它是由兼容 Multiboot2 的引导加载程序加载的。
  2. EBX 必须包含引导加载程序提供的 Multiboot2 信息结构体的 32 位物理地址(请参阅 Boot information format)。

这两个寄存器中的数据,会在后续内核代码中用到。

2 代码实现

官方文档提供了对应的示例代码:4.4 Example OS code

但是!

前文有提过,文档给出的 boot.S 是有 BUG 的!因为 没有 给 tag 的地址进行 8 字节对齐,导致了 GRUB 读取 tag 会出现错位。

我将完整的代码放在了附录部分。 本章节主要内容是依据 Multiboot2 规范,对代码片段进行分析。

2.1 定义 Multiboot header

gas
   
   #include "multiboot2.h"

   
   

   
           .text

   
           

   
   multiboot_header:

   
           /*  Align 64 bits boundary. */

   
           .align  8

   
           /*  magic */

   
           .long   MULTIBOOT2_HEADER_MAGIC

   
           /*  ISA: i386 */

   
           .long   MULTIBOOT_ARCHITECTURE_I386

   
           /*  Header length. */

   
           .long   multiboot_header_end - multiboot_header

   
           /*  checksum */

   
           .long   -(MULTIBOOT2_HEADER_MAGIC + MULTIBOOT_ARCHITECTURE_I386 + (multiboot_header_end - multiboot_header))

   
   

   
   entry_address_tag_start:    

   
           /* 每个 tag 都要 8 字节对齐 */

   
           .align  8

   
           .short MULTIBOOT_HEADER_TAG_ENTRY_ADDRESS

   
           .short MULTIBOOT_HEADER_TAG_OPTIONAL

   
           .long entry_address_tag_end - entry_address_tag_start

   
           /*  entry_addr */

   
           .long multiboot_entry

   
   entry_address_tag_end:

   
   

   
           /* 终止 tag 表示 tags 部分结束 */

   
   end_tag_start:

   
           /* 每个 tag 都要 8 字节对齐 */

   
           .align  8

   
           .short MULTIBOOT_HEADER_TAG_END

   
           .short 0

   
           .long end_tag_end - end_tag_start

   
   end_tag_end:

   
   multiboot_header_end:

   
   

   
   multiboot_entry:

   
           /* ...... */

为了代码的可读性,使用宏定义来表示数值。具体内容参考: multiboot2.h

根据规范要求,我们将 Multiboot header 定义在了 text 段的开头,使数据尽量靠前。

这里使用了 entry address tag 表示程序入口的地址,也就是 GRUB 执行内核时要跳转的目标。不过,其实还有一个方法可以设置程序入口。

gas
   
   #include "multiboot2.h"

   
   

   
           .text

   
   

   
           jmp     multiboot_entry

   
           

   
   multiboot_header:

   
           /*  Align 64 bits boundary. */

   
           .align  8

   
           /*  magic */

   
           .long   MULTIBOOT2_HEADER_MAGIC

   
           /*  ISA: i386 */

   
           .long   MULTIBOOT_ARCHITECTURE_I386

   
           /*  Header length. */

   
           .long   multiboot_header_end - multiboot_header

   
           /*  checksum */

   
           .long   -(MULTIBOOT2_HEADER_MAGIC + MULTIBOOT_ARCHITECTURE_I386 + (multiboot_header_end - multiboot_header))

   
   

   
           /* 终止 tag 表示 tags 部分结束 */

   
   end_tag_start:

   
           /* 每个 tag 都要 8 字节对齐 */

   
           .align  8

   
           .short MULTIBOOT_HEADER_TAG_END

   
           .short 0

   
           .long end_tag_end - end_tag_start

   
   end_tag_end:

   
   multiboot_header_end:

   
   

   
   multiboot_entry:

   
           /* ...... */

相较于上一个代码,我们在 text 段的开头添加 jmp multiboot_entry ,并删除 entry address tag ,也能实现相同的功能。

这是因为,在没有使用 tag 指定程序入口时, GRUB 会直接执行我们的操作系统程序。此时,运行的第一条指令就是我们添加的 jmp multiboot_entry

2.2 启动入口

gas
   
   #include "multiboot2.h"

   
   

   
   #ifdef HAVE_ASM_USCORE

   
   # define EXT_C(sym)                     _ ## sym

   
   #else

   
   # define EXT_C(sym)                     sym

   
   #endif

   
   

   
   #define STACK_SIZE                      0x4000

   
           

   
           .text

   
           

   
   multiboot_header:

   
           /* ...... */

   
   multiboot_header_end:

   
   

   
           /* 程序入口位置 */

   
   multiboot_entry:

   
           /*  Initialize the stack pointer. */

   
           movl    $(stack + STACK_SIZE), %esp

   
   

   
           /*  Reset EFLAGS. */

   
           pushl   $0

   
           popf

   
   

   
           /*  Push the pointer to the Multiboot information structure. */

   
           pushl   %ebx

   
           /*  Push the magic value. */

   
           pushl   %eax

   
   

   
           /*  Now enter the C main function... */

   
           call    EXT_C(cmain)

   
   

   
           /*  Halt. */

   
           pushl   $halt_message

   
           call    EXT_C(printf)

   
           

   
   loop:   hlt

   
           jmp     loop

   
   

   
   halt_message:

   
           .asciz  "Halted."

   
   

   
           /*  Our stack area. */

   
           .comm   stack, STACK_SIZE

接下来,到了操作系统入口位置。

首先,需要做的事情是初始化栈指针:

  1. #define STACK_SIZE 0x4000:用宏定义表示栈的大小
  2. .comm stack, STACK_SIZE.comm 指令用来分配一块未初始化的数据段内存,这里分配了 STACK_SIZE 字节的空间给 stack
  3. movl $(stack + STACK_SIZE), %esp:因为栈从顶部向下生长,所以将栈的顶部地址放入栈指针寄存器 %esp

接着清空 EFLAGS 寄存器:

  1. pushl $0:将立即数 0 压入栈
  2. popf:将栈顶的值弹出,并加载到 EFLAGS 寄存器

初始化完成后,就可以调用内核入口的 C 语言函数。我们之前在 1.2 机器状态中提到过, EAXEBX 寄存器保存着标识值和 Multiboot2 信息结构体地址,接下来内核会用到这些数据。由于内核代码是 C 函数,因此我们需要根据 C 语言的传参标准,按函数参数相反的顺序将数据压入栈中:

gas
   
   /* 内核入口函数定义: */

   
   /* void cmain (unsigned long magic, unsigned long addr) */

   
   

   
   pushl   %ebx

   
   pushl   %eax

   
   

   
   call    EXT_C(cmain)

2.3 内核代码

这部分的代码和官方文档中的 kernel.c 一致。该内核的主要功能是在屏幕上打印出 Multiboot2 信息结构,主要用于测试 Multiboot2 引导加载程序,同时也可作为实现 Multiboot2 内核的参考示例。

2.4 代码构建

需要先在附录中获取 boot.S, kernel.cmultiboot2.h 代码

makefile
   
   CC = gcc

   
   LD = ld

   
   CFLAGS = -m32 -fno-builtin -fno-stack-protector -nostartfiles

   
   LDFLAGS = -Ttext 0x100000 -melf_i386 -nostdlib

   
   KERNEL_NAME = kernel.bin

   
   

   
   all: $(KERNEL_NAME)

   
   

   
   $(KERNEL_NAME): boot.o kernel.o

   
   	$(LD) $(LDFLAGS) $^ -o $@

   
   

   
   boot.o: boot.S

   
   	$(CC) -c $(CFLAGS) $< -o $@

   
   

   
   kernel.o: kernel.c

   
   	$(CC) -c $(CFLAGS) $< -o $@

   
   

   
   clean:

   
   	rm -f *.o $(KERNEL_NAME)

简单说明一下编译选项:

makefile
   
   CFLAGS = -m32 -fno-builtin -fno-stack-protector -nostartfiles
  • -m32:让编译器生成 32 位代码
  • -fno-builtin:禁用编译器对标准库函数(如 memcpy、strlen 等)的内建优化实现。确保这些函数不被替换为编译器优化版本
  • -fno-stack-protector:禁用栈保护功能,否则会编译报错
  • -nostartfiles:不使用标准启动文件,因为操作系统的启动方式与常规程序不同
makefile
   
   LDFLAGS = -Ttext 0x100000 -melf_i386 -nostdlib

这些是传递给链接器(如 ld)的选项,用于控制链接行为:

  • -Ttext 0x100000:表示程序的代码段(text segment)将被放置在内存地址 0x100000 处,这是加载操作系统常用的位置
  • -melf_i386:指定输出文件的目标格式是 32 位的 ELF 格式(适用于 i386 架构),这是 Multiboot2 规范建议的格式
  • -nostdlib:让链接器不要链接标准库。这是必要的,因为在内核或引导程序中,不会使用标准 C 库,而是会自己实现所需的功能或直接操作硬件

3 镜像制作

总所周知,现代 PC 有 LegacyUEFI 两种启动方式,而接下来的镜像将会使用 Legacy + MBR 的启动方式。

选择 Legacy 的主要原因是,EFI 似乎只能输出像素,无法直接打印文本。这会导致我们无法查看内核打印的信息。

具体说法可以参考这个链接:https://forum.osdev.org/viewtopic.php?f=1&t=28429

3.1 创建镜像

使用 dd 命令创建一个 64M 的文件:

bash
   
   dd if=/dev/zero of=disk.img bs=1M count=64

使用 parted 为镜像文件分区:

bash
   
   parted -s disk.img mklabel msdos mkpart primary ext2 1MiB 100%

将镜像文件作为虚拟磁盘挂载,并创建 ext2 文件系统和挂载分区

bash
   
   sudo losetup -P /dev/loop0 disk.img

   
   sudo mkfs.ext2 /dev/loop0p1

   
   sudo mount /dev/loop0p1 /mnt

3.2 安装 GRUB

安装 Legacy 启动兼容的 GRUB ,并创建 grub.cfg 配置文件

bash
   
   sudo grub-install --target=i386-pc --boot-directory=/mnt/boot /dev/loop0

   
   

   
   sudo mkdir -p /mnt/boot/grub

   
   cat <<EOF > /mnt/boot/grub/grub.cfg

    
    set timeout=20

    
    set default=0

    
    

    
    menuentry "MyOS" {

    
        multiboot2 /boot/kernel.bin

    
        boot

    
    }

    
    EOF

配置文件里的启动方式要写 multiboot2 而不是 multiboot

安装完成后,取消挂载

bash
   
   sudo umount /mnt

   
   sudo losetup -d /dev/loop0

4 虚拟机运行

4.1 QEMU

运行目标平台为 i386 的 QEMU,内存要大于 128 M

bash
   
   qemu-system-i386 -m 1G -hda disk.img

这条蓝线也是 kernel.c 绘制的。如果你的机器和 GRUB 是 EFI 启动,就会发现无法输出字符,但是这个蓝线还在。因为,它是通过设置 framebuffer 像素实现的。

4.2 VirtualBox

在 VirtualBox 中运行需要先将镜像文件转换为 vdi 格式

bash
   
   VBoxManage convertdd disk.img disk.vdi --format VDI

接着注册硬盘,并添加到虚拟机的 IDE 控制器中

在设置中关闭 EFI

这样就可以正常启动了

附录:完整代码

write_grub_cfg.sh

别忘了加上可执行权限 chmod +x write_grub_cfg.sh

bash
   
   #!/bin/bash

   
   

   
   KERNEL_NAME=$1

   
   GRUB_CFG_PATH=$2

   
   

   
   cat <<EOF > $GRUB_CFG_PATH

    
    set timeout=20

    
    set default=0

    
    

    
    menuentry "MyOS" {

    
        multiboot2 /boot/$KERNEL_NAME

    
        boot

    
    }

    
    EOF

Makefile

makefile
   
   CC = gcc

   
   LD = ld

   
   CFLAGS = -m32 -fno-builtin -fno-stack-protector -nostartfiles

   
   LDFLAGS = -Ttext 0x100000 -melf_i386 -nostdlib

   
   KERNEL_NAME = kernel.bin

   
   IMG_NAME = disk.img

   
   IMG_SIZE = 64

   
   

   
   all: img

   
   

   
   $(KERNEL_NAME): boot.o kernel.o

   
   	$(LD) $(LDFLAGS) $^ -o $@

   
   

   
   boot.o: boot.S

   
   	$(CC) -c $(CFLAGS) $< -o $@

   
   

   
   kernel.o: kernel.c

   
   	$(CC) -c $(CFLAGS) $< -o $@

   
   

   
   .PHONY: img

   
   img: $(IMG_NAME) $(KERNEL_NAME)

   
   	sudo losetup -P /dev/loop0 $(IMG_NAME)

   
   	sudo mount /dev/loop0p1 /mnt

   
   	sudo ./write_grub_cfg.sh $(KERNEL_NAME) /mnt/boot/grub/grub.cfg

   
   	sudo cp $(KERNEL_NAME) /mnt/boot/

   
   	sudo umount /mnt

   
   	sudo losetup -d /dev/loop0

   
   

   
   

   
   $(IMG_NAME):

   
   	dd if=/dev/zero of=$(IMG_NAME) bs=1M count=$(IMG_SIZE)

   
   	parted -s $(IMG_NAME) mklabel msdos mkpart primary ext2 1MiB 100%

   
   	sudo losetup -P /dev/loop0 $(IMG_NAME)

   
   	sudo mkfs.ext2 /dev/loop0p1

   
   	sudo mount /dev/loop0p1 /mnt

   
   	sudo grub-install --target=i386-pc --boot-directory=/mnt/boot /dev/loop0

   
   	sudo mkdir -p /mnt/boot/grub

   
   	sudo umount /mnt

   
   	sudo losetup -d /dev/loop0

   
   

   
   qemu: img

   
   	qemu-system-i386 -m 1G -hda $(IMG_NAME)

   
   

   
   clean:

   
   	sudo umount /mnt || true

   
   	sudo losetup -d /dev/loop0 || true

   
   	rm -f *.o $(KERNEL_NAME) $(IMG_NAME)

   
   

boot.S

gas
   
   /*  boot.S - bootstrap the kernel */

   
   /*  Copyright (C) 1999, 2001, 2010  Free Software Foundation, Inc.

   
    *

   
    * This program is free software: you can redistribute it and/or modify

   
    * it under the terms of the GNU General Public License as published by

   
    * the Free Software Foundation, either version 3 of the License, or

   
    * (at your option) any later version.

   
    *

   
    * This program is distributed in the hope that it will be useful,

   
    * but WITHOUT ANY WARRANTY; without even the implied warranty of

   
    * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the

   
    * GNU General Public License for more details.

   
    *

   
    * You should have received a copy of the GNU General Public License

   
    * along with this program.  If not, see <http://www.gnu.org/licenses/>.

   
    */

   
   

   
   #define ASM_FILE        1

   
   #include "multiboot2.h"

   
   

   
   /*  C symbol format. HAVE_ASM_USCORE is defined by configure. */

   
   #ifdef HAVE_ASM_USCORE

   
   # define EXT_C(sym)                     _ ## sym

   
   #else

   
   # define EXT_C(sym)                     sym

   
   #endif

   
   

   
   /*  The size of our stack (16KB). */

   
   #define STACK_SIZE                      0x4000

   
           

   
           .text

   
           

   
   multiboot_header:

   
           /*  Align 64 bits boundary. */

   
           .align  8

   
           /*  magic */

   
           .long   MULTIBOOT2_HEADER_MAGIC

   
           /*  ISA: i386 */

   
           .long   MULTIBOOT_ARCHITECTURE_I386

   
           /*  Header length. */

   
           .long   multiboot_header_end - multiboot_header

   
           /*  checksum */

   
           .long   -(MULTIBOOT2_HEADER_MAGIC + MULTIBOOT_ARCHITECTURE_I386 + (multiboot_header_end - multiboot_header))

   
   entry_address_tag_start:        

   
           .align  8

   
           .short MULTIBOOT_HEADER_TAG_ENTRY_ADDRESS

   
           .short MULTIBOOT_HEADER_TAG_OPTIONAL

   
           .long entry_address_tag_end - entry_address_tag_start

   
           /*  entry_addr */

   
           .long multiboot_entry

   
   entry_address_tag_end:

   
   end_tag_start:

   
           .align  8

   
           .short MULTIBOOT_HEADER_TAG_END

   
           .short 0

   
           .long end_tag_end - end_tag_start

   
   end_tag_end:

   
   multiboot_header_end:

   
   multiboot_entry:

   
           /*  Initialize the stack pointer. */

   
           movl    $(stack + STACK_SIZE), %esp

   
   

   
           /*  Reset EFLAGS. */

   
           pushl   $0

   
           popf

   
   

   
           /*  Push the pointer to the Multiboot information structure. */

   
           pushl   %ebx

   
           /*  Push the magic value. */

   
           pushl   %eax

   
   

   
           /*  Now enter the C main function... */

   
           call    EXT_C(cmain)

   
   

   
           /*  Halt. */

   
           pushl   $halt_message

   
           call    EXT_C(printf)

   
           

   
   loop:   hlt

   
           jmp     loop

   
   

   
   halt_message:

   
           .asciz  "Halted."

   
   

   
           /*  Our stack area. */

   
           .comm   stack, STACK_SIZE

kernel.c

c

multiboot2.h

c

参考文献

Multiboot2 Specification version 2.0

写操作系统 之 GRUB 到 multiboot ——从 multiboot 开始对接内核(转载)

[操作系统原理与实现]Multiboot与GRUB_multiboot2-CSDN博客

grub2详解(翻译和整理官方手册) - 骏马金龙 - 博客园

用 GRUB 引导自己的操作系统_切换grub以实现系统的正常引导-CSDN博客

操作系统实现 - 055 multiboot2 头_哔哩哔哩_bilibili

MBR和GPT_mbr gap-CSDN博客


本文发布于2023年10月8日

最后修改于2024年10月8日


__EOF__

原创作者: ThousandPine 转载于: https://www.cnblogs.com/ThousandPine/p/18451835
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值