在上一篇中提到了x86 保护模式,那么什么是保护模式, 本文很好的梳理了保护模式和实模式。
实模式与保护模式的来历
最早期的8086 CPU只有一种工作方式,那就是实模式,而且数据总线为 16位,地址总线为20位,实模式下所有寄存器都是16位。而从80286开始就有了保护模式,从80386开始CPU数据总线和地址总线均为32位,而且寄存器都是32位。但80386以及现在的奔腾、酷睿等等CPU为了向前兼容都保留了实模式,现代操作系统在刚加电时首先运行在实模式下,然后再切换到保护模式下运行。
实模式寻址方式
刚才说了8086 CPU数据总线为16位,也就是一次最多能取2^16=64KB数据,这个数据也解释了实模式下为什么每个段最大只有64KB。但刚才还说了其地址总线为20位,这样它能寻址的能力其实是2^20=1MB,这也就是实模式下CPU的最大寻址能力。既然它有1MB寻址能力,那怎么用16位的段寄存器表示呢?
这就引出了分段的概念,8086CPU将1MB存储空间分成许多逻辑段,每个段最大限长为64KB(但不一定就是64KB)。这样每个存储单元就可以用“段基地址+段内偏移地址”表示。段基地址由16位段寄存器值左移4位表达,段内偏移表示相对于某个段起始位置的偏移量。比如:
SEG=0x07c0
jmpi offset, #SEG
offset: mov ax,cs
保护模式寻址方式
在定义“逻辑地址”时看到保护模式和实模式的区别在于它是用段选择符而非段基地址,这也许就是保护模式的真谛所在,从段入手,全面理解保护模式编程基本概念和寻址方式。
逻辑地址转换成线性地址的原理和过程如下:
2.段描述符表
段描述符表存放在由操作系统维护着的特殊数据结构之中,由处理器的内存管理硬件来引用。虚拟地址空间被分割成大小相等的两半,一半由GDT来映射,一半由LDT来映射。整个虚拟地址空间还有2的14次方个段,一半是由GDT映射的全局虚拟地址空间,一半是由LDT映射的局部虚拟地址空间。系统发生任务切换的时候,会更新任务的LDT。
每个系统必须定义一个GDT,用于系统中的所有任务和程序。可选择性定义若干个LDT。GDT本身不是一个段,而是线性地址空间的一个数据结构;GDT的线性基地址和长度必须加载进GDTR之中。因为段描述符长度是8,所以GDT长度位8n-1.同时,因为每个描述符长度是8,所以GDT的基地址最好进行8字节对齐。
LDT表存放在LDT类型的段之中,此时GDT必须含有LDT的段描述符。访问LDT需要使用段选择符,为了减少访问LDT时的段转换次数,LDT的段选择符,段基址,段限长都要放在LDTR寄存器之中。注意:查找GDT在线性地址中的基地址,需要借助GDTR;而查找LDT相应基地址,需要的是GDT中的段描述符。LDT本身是一个段,而GDT不是。
两外,使用SGDT和SIDT指令的时候,需要存储6B的“伪描述符”(baseaddress+limit),此时为了避免对齐检查出错,需要将它放在地址位基数开始的地方。
3.段选择符
段选择符也称为段选择子,16bit,它指向段描述符表中的段描述符。段选择符的结构如下:
段选择符示例:其中a~d分别表示内核代码段/内核数据段/任务代码段/任务数据段的值,分别是0x0008,0x0010,0x000f,0x0017.
段选择符通常是作为指针变量的一部分可见,但选择符的值通常是由链接或者加载器设置或者修改,而不是应用程序。(看图)
从上图中,我们需要注意以下几点:
1)段寄存器只有六个,一个程序可以定义很多段,但只能同时访问六个
2)我们提供隐藏部分,也就是描述符缓冲,来减少对描述符表的引用次数。
3)有缓存,必然涉及到缓存一致性的维护,我们在描述符表中的描述符修改过后立即更新缓存。
4)有两类加载指令可以改变段寄存器的值:MOV(pop/lds/les/lss/lgs/lfs)等显示指令和CALL(JMP/RET/IRET/INTn/INTO/INT3)等隐式加载指令。
4.段描述符
4.1段描述符的通用格式
对这个图的简要解释:
1)段限长:两个字段,一个20b,和G以及E地段决定段限长的实际大小和方向。
2)base:32b,一般是16字节对齐
3)type:指定段或者门的类型,访问种类和扩展方向,对它的解释需要依赖描述符类型标志S。具体解释结果如下:
4)描述符类型标志s
5)描述符特权级DPL
6)段存在标志P
7)默认操作大小/默认栈指针大小/上下界标志D/B
8)颗粒度标志G
4.2代码和数据段描述符类型
S=1的时候,该描述符用于代码段和数据段,意义如下表所示。
数据段的描述符,类型字段的低三位可以分别表示已访问(A),可写(W),拓展方向(E)
A位指名自从上次操作系统复位该位之后,一个段是否被访问过。当处理器将一个段选择符加载进入相关寄存器之后,就会置位该位,直到它被明确地清除。可用于虚拟内存管理和调试。
在保护模式下,代码段是不可写的。
4.3系统描述符类型
如果段描述符的S标志是0的话,那么该描述符是一个系统段描述符。处理器能够识别以下类型的系统段描述符。
1)局部描述符表的段描述符
2)任务段(TSS)描述符
3)调用门描述符
4)中断门描述符
5)陷阱门描述符
6)任务门描述符
两大类:系统段描述符和门描述符。它们的具体描述符如下,使用方法见后续的blog
后记:存储管理模型比较繁杂,而且对应具体的硬件和相应的数据结构,需要反复理解和记忆才能弄通,总之在这个过程中,有一个问题一直需要思考:XX是什么?怎么得到它?得到它了以后什么东西会用到它?另外,此处总结操作系统的一条规律:哪里有速度差,哪里就有缓存;哪里有缓存,哪里就有一致性维护。