一、背景知识
1、引导启动程序分为三个部分(bootsect.s / setup.s / head.s)
2、80x86结构的CPU在开机启动后,位于0xFFF0处的ROM-BIOS带电自检,检测和诊断相关硬件(不清楚是哪些硬件),并且在物理地址的起始地址0处设置和初始化中断向量(中断服务程序的入口地址。中断:在运行程序时出现异常和特殊的请求的时候,停止运行程序,转而去处理这些特殊的请求,处理完成后回到中断开始的地方接着去处理请求)。
然后将可启动设备(软驱或者磁盘)的0扇区0磁道(512字节)的内容(bootsect.s)读入内存中的0x7c00中。
在bootsect.s被执行的时候会将其移动到内存绝对地址0x90000处(为什么执行的时候要移动自己,害怕在以后加载system的时候被覆盖吗?)
之后会将setup.s的部分载入到内存0x90200处(bootsect.s的大小为512字节,换成16进制为200)
二、实验过程
实验开始
引导程序由BIOS加载和运行,操作系统此时还未被加载到内存当中,只能利用BIOS所提供的中断。
本实验所使用的中断为0x10和0x13中断
第一部分:bootsect.s在屏幕上输出开机需要输出的字符串
entry _start !伪代码entry使得由链接程序生成的可执行程序中有指定的标识和符号,告知链接程序,程序将从_start开始执行
_start: !指明程序的入口
!下面利用 BIOS INT 0x10 功能 0x03 和 0x13 来显示信息:
mov ah,#0x03 !获取光标的位置和形状
!BIOS 中断 0x10 功能号 ah = 0x03,读光标位置
xor bh,bh !bh=页号,读光标的位置,返回值在dx中
int 0x10 !中断
这个操作的返回值为:ch=行扫描开始,cl=行扫描结束(ch、cl这两个符号描述了光标的形状),dh=行号,dl=列号
页号相当于显示缓冲区界面的编号,默认第0页是活动的显示页。
! BIOS 中断 0x10 功能号 ah = 0x13,显示字符串。
mov cx,#38!将要打印的字符的长度。(位于msg1段内,字符串的长度为32,再包含3对回车和空格,共38个字符串)
! bh = 显示页面号;bl = 字符属性;dh = 行号;dl = 列号。
mov bx,#0x0007 !page 0, attribute 7 (normal)
! es:bp 此寄存器对指向要显示的字符串起始位置处
mov bp,#msg1 !要打印的字符串所放置的数据段的位置
mov ax,#0x07c0
mov es,ax
! 输入:al = 放置光标的方式及规定属性。0x01-表示使用 bl 中的属性值,光标停在字符串结尾处。
mov ax,#0x1301 !write string, move cursor
int 0x10 ! 写字符串并移动光标到串结尾处。
inf_loop: !无限循环的地址
jmp inf_loop !无条件跳转指令,无条件跳转到无限循环的地方,这样使得之前输出的字符能够一直在屏幕上显示
msg1:
.byte 13,10 !13为回车,10为换行
!13光标回到本行开头,10光标到下一行,不一定是在开头
.ascii "Hello OS world, my name is HeHao"
.byte 13,10,13,10
.org 510
!.org 伪指令的格式是 .org new_lc, fill
!把当前区的位置计数器设置为 new_lc
!当位置计数器值増长时,所跳跃过的字节将被填入值 fill
!如果省略了逗号和 fill,则填入 0
boot_flag:
.word 0xAA55
!设置引导扇区标记,必须在最后两个字节
将上述代码在开发环境中编译,得到Image文件
编译命令
$ as86 -0 -a -o bootsect.o bootsect.s
$ ld86 -0 -s -o bootsect bootsect.o
使用as86和ld编译器来进行编译
其中 -0(注意:这是数字 0,不是字母 O)表示生成 8086 的 16 位目标程序,-a 表示生成与 GNU as 和 ld 部分兼容的代码,-s 告诉链接器 ld86 去除最后生成的可执行文件中的符号信息。
如果文件中有语法错误都会有相应的输出信息,如果没有输出信息说明编译都通过了。
使用ls -al来看编译后生成的文件的信息,
bootsect 的文件大小是 544 字节,而引导程序必须要正好占用一个磁盘扇区,即 512 个字节。造成多了 32 个字节的原因是 ld86 产生的是 Minix 可执行文件格式,这样的可执行文件处理文本段、数据段等部分以外,还包括一个 Minix 可执行文件头部,它的结构如下:
struct exec {
unsigned char a_magic[2]; //执行文件魔数
unsigned char a_flags;
unsigned char a_cpu; //CPU标识号
unsigned char a_hdrlen; //头部长度,32字节或48字节
unsigned char a_unused;
unsigned short a_version;
long a_text; long a_data; long a_bss; //代码段长度、数据段长度、堆长度
long a_entry; //执行入口地址
long a_total; //分配的内存总量
long a_syms; //符号表大小
};
6 char(6 字节)+ 1 short(2 字节) + 6 long(24 字节)= 32,正好是 32 个字节,去掉这 32 个字节后就可以放入引导扇区了(这是 tools/build.c 的用途之一)。
对于上面的 Minix 可执行文件,其 a_magic[0]=0x01,a_magic[1]=0x03,a_flags=0x10(可执行文件),a_cpu=0x04(表示 Intel i8086/8088,如果是 0x17 则表示 Sun 公司的 SPARC),所以 bootsect 文件的头几个字节应该是 01 03 10 04。
Ubuntu 下用命令“hexdump -C bootsect”可以看到。
00000000 01 03 10 04 20 00 00 00 00 02 00 00 00 00 00 00 |.... ...........|
00000010 00 00 00 00 00 00 00 00 00 82 00 00 00 00 00 00 |................|
00000020 b8 c0 07 8e d8 8e c0 b4 03 30 ff cd 10 b9 17 00 |.........0......|
00000030 bb 07 00 bd 3f 00 b8 01 13 cd 10 b8 00 90 8e c0 |....?...........|
00000040 ba 00 00 b9 02 00 bb 00 02 b8 04 02 cd 13 73 0a |..............s.|
00000050 ba 00 00 b8 00 00 cd 13 eb e1 ea 00 00 20 90 0d |............. ..|
00000060 0a 53 75 6e 69 78 20 69 73 20 72 75 6e 6e 69 6e |.Sunix is runnin|
00000070 67 21 0d 0a 0d 0a 00 00 00 00 00 00 00 00 00 00 |g!..............|
00000080 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 |................|
*
00000210 00 00 00 00 00 00 00 00 00 00 00 00 00 00 55 aa |..............U.|
00000220
在Ubuntu下面使用一个命令,可以将该文件前32个字节去掉
$ dd bs=1 if=bootsect of=Image skip=32
(dd实现输入文件到输出文件的拷贝、if 输入文件、of 输出文件 、bs 同时设置读/写缓冲区的字节数 )
当前的工作路径为,这个可以使用pwd来查看
/home/shiyanlou/oslab/linux-0.11/boot/
将刚刚生成的 Image 复制到 linux-0.11 目录下
$ cp ./Image ../Image
执行 oslab 目录中的 run 脚本
$ ../../run
以上的bootsect.s只是实现了屏幕上开机引导的字符的输出
并未实现将setup.s加载入内存的功能。
第二部分:setup在屏幕上输出需要输出的字符串
entry _start !伪代码entry使得由链接程序生成的可执行程序中有指定的标识和符号,告知链接程序,程序将从_start开始执行
_start: !指明程序的入口
!获取光标的位置
mov ah,#0x03 !获取光标的位置和形状
xor bh,bh !bh=页号
int 0x10 !中断
这个操作的返回值为:ch=行扫描开始,cl=行扫描结束(ch、cl这两个符号描述了光标的形状),dh=行号,dl=列号
页号相当于显示缓冲区界面的编号,默认第0页是活动的显示页。
!在屏幕上输出字符串(放置在es:bp当中)
mov cx,#25!将要打印的字符的长度。(位于msg2段内,字符串的长度为32,再包含3对回车和空格,共38个字符串)
mov bx,#0x0007 !page 0, attribute 7 (normal)
mov bp,#msg2 !要打印的字符串所放置的数据段的位置
mov ax,cs
mov es,ax !设置数据段放置bootsect.s
mov ax,#0x1301 !write string, move cursor
int 0x10 !中断
inf_loop: !无限循环的地址
jmp inf_loop !无条件跳转指令,无条件跳转到无限循环的地方,这样使得之前输出的字符能够一直在屏幕上显示
msg2:
.byte 13,10 !13为回车,10为换行
!13光标回到本行开头,10光标到下一行,不一定是在开头
.ascii "NOW we are in SETUP"
.byte 13,10,13,10
.org 510
!.org 伪指令的格式是 .org new_lc, fill
!把当前区的位置计数器设置为 new_lc
!当位置计数器值増长时,所跳跃过的字节将被填入值 fill
!如果省略了逗号和 fill,则填入 0
boot_flag:
.word 0xAA55
!设置引导扇区标记,必须在最后两个字节
第三部分:通过bootsect.s将setup.s加载入内存
SETUPLEN=2 !setup程序代码占用的磁盘扇区数
!(疑问,原来的磁盘扇区数目不是四个吗?)
SETUPSEG=0x07e0
entry _start
_start:
mov ah,#0x03
xor bh,bh
int 0x10
mov cx,#36
mov bx,#0x0007
mov bp,#msg1
mov ax,#0x07c0
mov es,ax
mov ax,#0x1301
int 0x10
!以上和第一部分的代码一样
!利用 ROM BIOS 中断 INT 0x13 将 setup 模块从磁盘第 2 个扇区开始读到
! 0x90200 开始处,
load_setup:
! dh = 磁头号; dl = 驱动器号(如果是硬盘则位 7 要置位);
! 设置驱动器和磁头(drive 0, head 0): 软盘 0 磁头 0
mov dx,#0x0000
! ch = 磁道(柱面)号的低 8 位; cl = 开始扇区(位 0-5),磁道号高 2 位(位 6-7);
! 设置扇区号和磁道(sector 2, track 0): 0 磁头、0 磁道、2 扇区
mov cx,#0x0002
!address = 512, in INITSEG
! 设置读入的内存地址:BOOTSEG+address = 512,偏移512字节
mov bx,#0x0200
! 设置读入的扇区个数(service 2, nr of sectors),
! SETUPLEN是读入的扇区个数,Linux 0.11 设置的是 4,
! 我们不需要那么多,我们设置为 2(因此还需要添加变量 SETUPLEN=2)
! ah = 0x02 - 读磁盘扇区到内存;al = 需要读出的扇区数量;
mov ax,#0x0200+SETUPLEN
! 应用 0x13 号 BIOS 中断读入 2 个 setup.s扇区
int 0x13 !read it
! 读入成功,跳转到 ok_load_setup: ok - continue
jnc ok_load_setup
! 软驱、软盘有问题才会执行到这里。
mov dx,#0x0000
! 否则复位软驱 reset the diskette
mov ax,#0x0000
int 0x13
! 重新循环,再次尝试读取
jmp load_setup
ok_load_setup:
!设置CS=0x90200,IP=0。
!jmpi段间跳转指令
jmpi 0,SETUPSEG
msg1:
.byte 13,10
.ascii "Hello OS world, my name is LZJ"
.byte 13,10,13,10
.org 510
boot_flag:
.word 0xAA55
借助MakeFile来进行bootsect.s和setup.s的编译。
在 Ubuntu 下,进入 linux-0.11 目录后,使用下面命令(注意大小写):
$ make BootImage
会在信息的最后一行看到
Unable to open 'system'
make: *** [BootImage] Error 1
有 Error!这是因为 make 根据 Makefile 的指引执行了 tools/build.c,它是为生成整个内核的镜像文件而设计的,没考虑我们只需要 bootsect.s 和 setup.s 的情况。它在向我们要 “系统” 的核心代码。为完成实验,接下来给它打个小补丁。
修改 build.c
build.c 从命令行参数得到 bootsect、setup 和 system 内核的文件名,将三者做简单的整理后一起写入 Image。其中 system 是第三个参数(argv[3])。当 “make all” 或者 “makeall” 的时候,这个参数传过来的是正确的文件名,build.c 会打开它,将内容写入 Image。而 “make BootImage” 时,传过来的是字符串 “none”。所以,改造 build.c 的思路就是当 argv[3] 是"none"的时候,只写 bootsect 和 setup,忽略所有与 system 有关的工作,或者在该写 system 的位置都写上 “0”。
修改工作主要集中在 build.c 的尾部,可以参考下面的方式,将圈起来的部分注释掉。
再次编译运行
$ cd ~/oslab/linux-0.11
$ make BootImage
$ ../run
第四部分:用setup.s获取基本硬件参数
setup.s获取硬件的参数,并且将其存放在内存0x90000处
INITSEG = 0x9000
entry _start
_start:
! Print "NOW we are in SETUP"
mov ah,#0x03
xor bh,bh
int 0x10
mov cx,#25
mov bx,#0x0007
mov bp,#msg2
mov ax,cs
mov es,ax
mov ax,#0x1301
int 0x10
mov ax,cs
mov es,ax
!以上两行的作用没有看懂
! init ss:sp(初始化栈段)
mov ax,#INITSEG
mov ss,ax
mov sp,#0xFF00
! Get Params
!设置ds为0x9000
mov ax,#INITSEG
mov ds,ax
!读入光标的位置
mov ah,#0x03
xor bh,bh
int 0x10
!将光标的位置存入到内存当中(ds:0x0000)
mov [0],dx
!读扩展内存大小,超过1M则为扩展
mov ah,#0x88
int 0x15
mov [2],ax
!读第1个磁盘参数表,共16个字节大小;其首地址在int 0x41的中断向量位置
!中断向量表的起始地址是0x000, 共1KB大小,并且每个表项占4B
!所以第1个磁盘参数表的首地址的地址:0x41*4=0x104, 此处4B由段地址和偏移地址组成
mov ax,#0x0000
mov ds,ax
lds si,[4*0x41]
!从内存指定位置处读取一个长指针值,并放入 ds 和 si 寄存器。ds 中放段地址,
! si 是段内偏移地址。这里是把内存地址 4 * 0x41(= 0x104)处保存的 4 个字节读出。这 4 字节即是硬盘参数表所处位置的段和偏移值。
!! 取中断向量 0x41 的值,即 hd0 参数表的地址(ds:si)
mov ax,#INITSEG
mov es,ax
mov di,#0x0004 !传输的目的地址: 0x9000:0x0004 (es:di)
mov cx,#0x10 !共传输 16 字节。/重复16次
rep !表示重复
movsb !movsb以字节为单位进行移动
!补充:
1)movsb以字节为单位进行移动
2)movsd以双字为单位进行移动
3)movsw以字为单位进行移动
! Be Ready to Print
mov ax,cs
mov es,ax
mov ax,#INITSEG
mov ds,ax
! Cursor Position
!和第一部分的bootsect.s是一样的,读入光标的位置和打印相应的字符的位置
mov ah,#0x03
xor bh,bh
int 0x10
mov cx,#18
mov bx,#0x0007
mov bp,#msg_cursor
mov ax,#0x1301
int 0x10
!将内存的大小放入0x90000
mov dx,[0]
以16进制打印数据
call print_hex
! Memory Size
mov ah,#0x03
xor bh,bh
int 0x10
mov cx,#14
mov bx,#0x0007
mov bp,#msg_memory
mov ax,#0x1301
int 0x10
mov dx,[2]
call print_hex
! Add KB
mov ah,#0x03
xor bh,bh
int 0x10
mov cx,#2
mov bx,#0x0007
mov bp,#msg_kb
mov ax,#0x1301
int 0x10
! Cyles
mov ah,#0x03
xor bh,bh
int 0x10
mov cx,#8
mov bx,#0x0007
mov bp,#msg_cyles
mov ax,#0x1301
int 0x10
mov dx,[4]
call print_hex
! Heads
mov ah,#0x03
xor bh,bh
int 0x10
mov cx,#8
mov bx,#0x0007
mov bp,#msg_heads
mov ax,#0x1301
int 0x10
mov dx,[6]
call print_hex
! Secotrs
mov ah,#0x03
xor bh,bh
int 0x10
mov cx,#10
mov bx,#0x0007
mov bp,#msg_sectors
mov ax,#0x1301
int 0x10
mov dx,[12]
call print_hex
inf_loop:
jmp inf_loop
!以16进制
print_hex:
!打印4个十六进制数字
mov cx,#4
print_digit:
rol dx,#4
mov ax,#0xe0f
and al,dl
add al,#0x30
cmp al,#0x3a
jl outp
add al,#0x07
outp:
int 0x10
loop print_digit
ret
print_nl:
mov ax,#0xe0d ! CR
int 0x10
mov al,#0xa ! LF
int 0x10
ret
msg2:
.byte 13,10
.ascii "NOW we are in SETUP"
.byte 13,10,13,10
msg_cursor:
.byte 13,10
.ascii "Cursor position:"
msg_memory:
.byte 13,10
.ascii "Memory Size:"
msg_cyles:
.byte 13,10
.ascii "Cyles:"
msg_heads:
.byte 13,10
.ascii "Heads:"
msg_sectors:
.byte 13,10
.ascii "Sectors:"
msg_kb:
.ascii "KB"
.org 510
boot_flag:
.word 0xAA55