操作系统引导探究 (Version 0.02)

说明:
QQ:13916830
email:xieyubo@126.com
欢迎来信指教,如转载请注明作者及出处.

下载原文(pdf)

源代码下载

原文:http://purec.binghua.com/Article/Class6/Class7/200411/81.html
注: 此文发表在
<<纯C论坛·电子杂志>>2004.10期
(
http://purec.binghua.com/Soft/Class2/dl_hpcem/200410/74.html)



操作系统引导探究 (Version 0.02)

哈尔滨工业大学计算机体系结构实验室 谢煜波(xieyubo@126.com)

 

Version 0.02修改记录:

    对与GDT有关的段描述符方面的描述进行了修订,更正了上一个版本中出现的一些错误,增加了一些描述,使其更完善。

    与上个版本中不同的地方均用红色标记。

 

前言

本篇文章并不旨在完整的讨论一个多引导系统程序怎样去引导不同的操作系统,而只打算从编写操作系统的角度出发,谈谈计算机怎样从加电开始,从无到有,将操作系统运行起来,在其中将尽量详尽的描述从实模式到保护模式的过渡,目的只在于能将所学与广大爱好者享,为希望开发操作系统的朋友留下一点资料,也为自己留下一点心得。

本篇文章将以开发中的pyos系统引导程序为例,pyos是一个正在开发中的实验型操作系统,它并不打算以目前任何一种运行中的操作系统为模式,而只想通过自己编写一个从头到尾的操作系统来学习知识,积累技术,如果你有兴趣,非常欢迎你的加入!

本篇纯属学习过程中的一点心得体会,如果你发现其中有错误或不当之处,非常希望你来信指教。

 

一、计算机从加电开始都做了什么?

当机算机的电源键被按下时,同这个键相联的电信号线就会送出一个电信号给主板,主板将此电信号传给供电系统,供电系统开始工作,为整个系统供电,并送出一个电信号给BIOS,通知BIOS供电系统已经准备完毕。随后BIOS启动一个程序,进行主机自检,主机自检的主要工作是确保系统的每一个部分都得到了电源支持,内存储器、主板上的其它芯片、键盘、鼠标、磁盘控制器及一些I/O端口正常可用,此后,自检程序将控制权还给BIOS。接下来BIOS读取BIOS中的相关设置,得到引导驱动器的顺序,然后依次检查,直到找到可以用来引导的驱动器(或说可以用来引导的磁盘,包括软盘、硬盘、光盘等),然后调用这个驱动器上磁盘的引导扇区进行引导。BIOS是怎么知道或说分辨哪一个磁盘可以用来引导的呢?

 

二、认识引导程序

BIOS磁盘的第一个扇区(磁盘最开始的512字节)载入内存,放在0x0000:0x 7c 00处(见图三),如果个扇区的最后两个字节是“55 AA”,那么这就是一个引导扇区,这个磁盘也就是一块可引导盘。通常这个大小为512B的程序就称为引导程序(boot)。如果最后两个字节不是“55 AA”,那么BIOS就检查下一个磁盘驱动器。

通过上面的表述我可以总结出如下三点引导程序所具有的特点:

1.               它的大小是512B,不能多一字节也不能少一字节,因为BIOS只读512B到内存中去。

2.               它的结尾两字节必须是“55 AA”,这是引导扇区的标志。

3.               它总是放在磁盘的第一个扇区上(0磁头,0磁道,1扇区),因为BIOS只读第一个扇区。


(图一)

 

因此,在我们编写引导程序的时候,我们也必须注意上面的三点原则,符合上面三点原则的程序都可以看作是引导程序,至少BIOS是这样认为的,虽然它也许可能是你随意写的一段并没有什么实际意义的代码。

因为BIOS一次只读一个扇区也即512字节的数据到内存中,这显然是不够的,现在操作系统都比较庞大,因此我们必须在引导扇区里将存在磁盘上的操作系统的核心部分读进内存,然后再跳转到操作系统的核心部分去执行。

 

三、通过BIOS读磁盘扇区

从上面的描述我们可以知道,引导程序需要将存在于磁盘上的操作系统读入内存,因此这里我们不得不再讲一讲,怎样不通过操作系统(因为现在还没有操作系统)去读磁盘上的内容。一般说来这有两种方法可以实现,一种是直接读写磁盘的I/O端口,一种是通过BIOS中断实现。前一种方法是最低层的方法(后一种方法也是在它的基础上实现的),具有极高的灵活性,可以将磁盘上的内容读到内存中的任意地方,但编程复杂。第二种方法是前一种方法稍微高层一点的实现,牺牲了一点灵活性,比如,它不能把磁盘上的内容读到0x0000:0x0000 ~ 0x0000:0x03FF处。为什么不能读到此处呢?这里我们将不得不描述一下CPU在加电后的中断处理机制。

 

3.1 BIOS的中断处理

中断是什么相信学过计算机的人都不会陌生,如果你对中断一点都不了解建议你翻看一下《计算机组成原理》(高等教育出版社  唐朔飞),上面有非常详尽的描述,而一般的汇编教材也多有谈及,因此这里只打算讲讲BIOS对中断的处理。


(图二)

 

由上图(图二)我们可以清楚的看到,当中断信号产生时,中断信号通过“中断地址形成部件”产生一个中断向量地址,此向量地址其实就是指向一个实际内存地址的指针,而这个实际内存地址中往往排一条跳转指令(jmp)跳转到实际处理此中断的中断服务程序中去执行。这一块专门用于处理中断跳转的内存就被称为中断向量表。在内存中这块中断向量表被放在什么地方?而实际的中断处理程序又在什么地方

 

3.2 系统的内存安排( 1M

要回答上面的两个问题,我们需要看看系统中内存是怎么安排的。在CPU被加的时候,最初的 1M 的内存,是由BIOS为我们安排好了的,每一字节都有特殊的用处。


(
图三)

 

由上图我们现在可以很方便的问答上面提出的两个问题。由于0x00000~0x003FF是中断向量表所在,因此不能将磁盘的操作系统读到此处,因为这样会覆盖中断向量表,就无法再通过BIOS中断读取磁盘内容了。你也许会说:我是先调用中断,再读的啊。但事实BIOS在读的过程中自己会多次调用其它中断辅助完成。

 

3.3 利用BIOS 13号中断读取磁盘扇区

有了前面的描述作为基础,下面我们可以正式描述怎样通过BIOS中断读取磁盘扇区了。要读取磁盘扇区,我们需要使用BIOS13号中断,13号中断会将几个寄存器的值作为其参数,因此,我们在调用13号中断的过程中需要首先设置寄存器。那么当怎样设置寄存器呢?会用到哪些寄存器呢?请往下看:

AH寄存器:存放功能号,为2的时候,表示使用读磁盘功能

DL寄存器:存驱动器号,表示欲读哪一个驱动器

CH寄存器:存磁头号,表示欲读哪一个磁头

CL寄存器:存扇区号,表示欲读的始扇区

AL寄存器:存计数值,表示欲读入的扇区数量

在设置了这几个寄存器后,我们就可以使用 int 13这条指令调用BIOS 13号中断读取指定的磁盘扇区,它将磁盘扇区读到ES:BX处,因此,在调用它之前,我们实际上还需要设置ESBX寄存器,以指出数据在内存中存放的位置。

 

四、保护模式下段模式内存地址的访问

写程序离不开对内存的访问,然而在保护模式下内存的访问与在实模式下内存的访问完全不同,这里我们将详细描述一下保护模式下内存的访问方法。当然,这里并不打算完整的介绍保护模式下所有的内存访问方法与机制,只介绍从实模式转到保护模式下所需要进行的转换,完整的内存访问请你参见Intel用户手册》当然,随着pyos的实验进行,我也会在后面的实验报告与心得体会中渐渐描述。

 

4.1 实模式下的内存访问

计算机在加电时,处于“实模式”,在计算机中有一个CR0寄存器,又称为0号控制寄存器,在这个寄存器中,最低位也即第0位,被称为PMProtected Modle:保护模式)位,当它被清零的时候表示CPU在“实模式”下工作,当它被置位的时候表示CPU在“保护模式”下工作。在计算机加电的时候,它是被清零的,所在这个时候的计算机,处于“实模式”。

“实模式”下的内存访问通过段寄存器与偏移量构成,比如前面描述中常常出现的0x:0000:0x0001就是一个实模式下的内存地址。分号前面的值表段寄存器中的值,分号后面的值表偏移量,实际物理地址的形成如下图所示:


(图四)

 

然而在保护模式下,内存地址却不是如上图所示的方法形成的。那么它又怎样形成的呢?

 

4.2 保护模式下的内存地址形成

保护模式下内存地址就复杂多了, 我们首先要分清三个概念:逻辑地址线性地址物理地址。物理地址很好理解,逻辑地址也好理解,就是程序所使用的地址。那么什么是线性地址呢?

其实如果不使用分页机制的话,线性地址就是物理地址,它与物理地址是一一对应的,线性地址0,也就是物理地址0。但我们知道,32位的CPU拥有32根地址线,也就是可以访问:

 =  4GB

的内存空间,这实是一个太大的空间了!现在很少有机器的物理内存能有这么大。那怎么在有限的物理空间中使用4GB的空间呢?人们把物理内存分成许多页,同样也把整个4GB的线性地址空间分成大小相同的许多页。在线性地址空间中,当某些页被使用的时候,某些页可能没有被使用,操作系统可以让CPU将没有被使用的页调出物理内存(存放在磁盘的某个地方,以备需要的时候再次调入),而把需要使用的页调入,这样,虽然物理内存空间有限,但也几乎可以使用所有的线性地址空间了。这就称为从线性地址到物理地址的映射,这是一个多对一的映射,也就是说多个线性空间中的页对应一个物理空间中的页,希望下面一幅图能有助于你理解这样的分页机制。


(图五)

 

上面是一种最简单的映射方式,术语称作“直接相连”映射,它大约只能用来说明问题,而在一个实际的操作系统中通常是“全相联相连”映射,也就是说线性地址中的页可以是映射到物理地址中的任何一个页中,只要那块物理地址空间现在是空闲的。不过,通过上图也能说明问题,当线性地址中的页5需要被访问时,CPU通过地址映射机制将其转换到物理地址,发现其对应物理地址中的页1。于是CPU会产生一个所谓的缺页中断来通知操作系统进行处理,操作系统相应这个中断,并在中断服务程序中将物理地址页1中的内容放到盘上的一个地方(虚拟内存),然后将线性地址中的页5载入物理内存页1中。这里就当可以比较明显的区别什么是线性地址,什么是物理地址了。

然而,当不使用分页机制的时候,线性地址就会被CPU当做物理地址来使用,线性地址会被直接放在CPU的地址信号线上。不过,在编写应用程序的时候,我们通常使用的却是另一种地址——逻辑地址,从逻辑地址到线性地址也存在着与上述机制类似的一种映射机制,不过这个机制常常称为“段模式”,它是由操作系统与CPU硬件共同完成的。操作系统的任务就是分配映射表,而CPU硬件的任务就是按着

  • 1
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 7
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值