操作系统之保护模式

保护模式概述

** 问题1:为什么会有保护模式**

  • 实模式下操作系统和用户程序属于同一特权级
  • 用户程序所引用的地址都是指向真实的物理地址
  • 用户程序可以自由修改段基址,可以访问所有内存
    以上三个原因属于安全缺陷
  • 访问超过64KB的内存区域时要切换段基址
  • 一次只能运行一个程序,无法充分利用计算机资源
  • 共20条地址线,最大可用内存为1MB
    为了克服这种恶劣的内存管理方式,处理器厂商开发出保护模式,这样,物理内存地址不能直接被程序访问,程序内部的地址(虚拟地址)需要被转化为物理地址后再去访问

注意:实模式不是32位CPU,变成了16位

  • 我们说实模式时,指的是32位的CPU运行在16位模式下的状态,就像大学生去做小学生的题一样,无非是大马拉小车

初见保护模式

保护模式之寄存器扩展

为了让一个寄存器就能访问4GB空间,需要寄存器宽度提升到32位
寄存器要保持向下兼容,不能推翻之前的方案从头再来,必须在原有的基础上扩展,各寄存器在原有16位的基础上,再次向高位扩展了16位,成为了32位寄存器
在这里插入图片描述
偏移地址还在和实模式下的一样,但段基址可不是简单的一个地址的事了,为了更加安全,怎么也得多添加点约束条件才靠谱,这些"约束条件"便是对内存段的描述信息,由于信息比较多,所以专门找了个数据结构——全局描述符表,既然叫表,就说明里面有表项,表中至少有一个表项,其中每一个表项称为段描述符,其大小为64字节,用来描述各个内存段的起始地址,大小,权限等信息
段寄存器保存的再也不是段基址了,里面保存的内容叫"选择子",该选择子其实就是个数,用这个数来索引全局描述符表中的段描述符
访问段描述符非常耗费时间,所以在80286的保护模式下,为了提高获取段信息的效率,对段寄存器率先应用了缓存技术,将段信息用一个寄存器来缓存,这就是段描述符缓冲寄存器,对程序员而言它是不可见的,CPU每次将获取到的内存段信息,整理后,存入段描述符缓冲寄存器,以后每次访问相同的段时,就直接读取该段寄存器对应的段描述符缓冲寄存器

保护模式之寻址扩展

进入保护模式后,寻址方式也有了很大进步,基址,变址,寻址变得更加灵活了
实模式下对于内存寻址来说,其中的基址寻址,变址寻址,基址变址寻址,这三种形式中的基址寄存器只能是bx,bp,变址寄存器只能是si,di,其中bx默认的段寄存器是ds,它经常用于访问数据段,bp默认的段寄存器是ss,它经常用于访问栈
在保护模式下,同样是内存寻址中,基址寄存器不再只是bx,bp,而是所有32位的通用寄存器,变址寄存器不再只是si,di,而是除esp之外的所有32位通用寄存器,偏移量由实模式的16位变成了32位,还可以对变址寄存器乘以一个比例因子,比例因子,只能是1,2,4,8
在这里插入图片描述

全局描述符表

保护模式下,内存段不再是简单地用段寄存器记载一下段基址就能用了,段的信息增加了很多,需要提前把段定义好才能使用
全局描述符表是保护模式下内存段的登记表,这是不同于实模式的显著特征之一

段描述符

对于IA32架构的处理器,访问内存采用"段基址:段内偏移量”形式,即使到了保护模式,也绕不开这个限制
现在为了安全性,需要给内存段添加一些额外的安全属性,这些安全属性存放在内存当中
** 问题2:需要添加哪些属性来描述内存段**

  • 实模式下的用户程序可以破坏存储代码的内存区域,所以要添加个内存段类型属性来阻止这种行为
  • 实模式下的用户程序和操作系统是同一级别的,所以要添加个特权级属性来区分用户程序和操作系统的地位
  • 内存段时一片内存区域,访问内存就要提供段基址,所以要有段基址属性
  • 为了限制程序访问内存的范围,还要对段大小进行约束,所以要有段界限属性
    这些用来描述内存段的属性,被放到了一个称为段描述符的结构中,该结构专门用来描述一个内存段,该结构是8字节大小
    在这里插入图片描述
    段界限表示段边界的扩展最值,扩展方向只有上下两种,对于数据段和代码段,段的扩展方向是向上的,即地址越来越高,此时的段界限用来表示段内偏移的最大值,对于栈段,段的扩展方向是向下,即地址越来越低,此时的段界限用来表示段内偏移的最小值
    段界限用20个二进制来表示,只不过此段界限只是个单位量,它的单位要么是字节,要么是4KB,这是由描述符中的G位来指定的,最终段的边界是此段界限值*单位,故段的大小要么是2的20次方等于1MB,要么是2的32次方(4KB等于2的12次方,12+20=32)等于4GB
    上面说的1MB和4GB只是个范围,由于段界限只是个偏移量,是从0算起的,所以实际的段界限边界值=(描述符中段界限+1) x (段界限的粒度大小:4KB或者1) -1
    如果G位为0,表示段界限粒度大小为1字节,实际段界限=(描述符中段界限+1)*1-1=描述符中段界限,段界限实际大小就等于描述符中的段界限值
    段界限用来限制段内偏移地址的,段内偏移地址必须位于段的范围之内,否则CPU会抛异常,根据段的扩展方向,此"段界限x单位“”便是段内偏移地址的最大值(向上扩展)或最小值(向下扩展),任何超过此值的偏移地址都被认为是非法访问
    从图上看,20位的段界限属性,被拆分成两部分,这属于历史遗留问题,为了兼容CPU不得不兼顾过去的产品
    不过不需要太担忧这样会影响CPU获取段信息的效率,因为段信息会被CPU缓存到段描述符缓冲寄存器中,此缓冲寄存器的内容便是段描述符中的内容,它是经过CPU整理后的,段界限和段基址已经被拼接到一起了,CPU下次会自动到段描述符缓冲器中取段数据
    0-7位是段基址的16-23,24-31位是段基址的24-31位,加上在段描述符低32位中的段基址0-15位,这下32位基地址才算齐全
    8-11位是type字段,共4位,用来指定本描述符的类型,一个段描述符,在CPU眼里分为两大类,要么描述的是系统段,要么描述的是数据段,这是由段描述符的S位决定的
    在CPU眼里,凡是硬件运行需要的东西都称为系统,凡是软件(操作系统也属于软件,CPU眼里,它与用户程序无区别)需要的东西都称为数据,所以代码段在段描述符中也属于数据段,S为0时表示系统段,S为1时表示数据段

问题三:什么是系统段
各种称为"门"的结构便是系统段,也就是硬件系统需要的结构,非软件使用的,如调度门,任务门,简而言之,门的元素就是入口,它通往一段程序
type字段,该字段共4位,用来表示内存段或门的子类型
在这里插入图片描述
表中A位表示Accessed位,这是CPU来设置的,没当该段被CPU访问过后,CPU就将此位置1,所以,创建一个新段描述符时,应该将此位置0,在调试时,根据该为便能判断该描述符是否可用了
C表示一致性代码段,C为1时表示该段时一致性代码段,C为0时表示该段为非一致性代码段
R表示可读,R为1表示可读,R为0表示不可读
X表示该段是否可执行
E是用来标识段的扩展方向,E为0表示向上扩展,E为1表示向下扩展
W是指段是否可写,W为1表示可写,通常用于数据段,W为0
段描述符的第13-14位是DPL字段,即描述符特权级
这两位能表示4种特权级,分别是0,1,2,3,级特权,数字越小,特权级越大
段描述符的第15位是P字段,即段是否存在,如果段存在于内存中,P为1,否则P为0

全局描述符GDT,局部描述符LDT级选择子

一个段描述符只用来定义一个内存段
这些描述符放在全局描述表中,全局描述表GDT相当于是描述符的数组,数组中的每个元素都是8字节的描述符
全局描述符表位于内存中,需要用专门的寄存器指向它,这个专门的寄存器便是GDTR,专门用来存储GDT的内存地址及大小
段描述符有了,描述符表也有了,我们该如何使用它,下面我们引出新的概念:段的选择子
段寄存器CS,DS,ES,FS,GS,SS,在实模式下,段中存储的是段基地址,即内存段的起始地址,而在保护模式下,由于段基址已经存入到段描述符中,所以段寄存器中再放段基址没有意义,在段基址中存入的是一个叫作选择子的东西——selector
由于段寄存器是16位,所以选择子也是16位,在其低2位即第0-1位,用于存储RPL,即请求特权级,可以表示0,1,2,3四种特权级,在选择子的第2位是TI位,用来指示选择子是在GDT中,还是在LDT中索引描述符,1表示在LDT中索引描述符,0表示在GDT中缩影描述符,选择子的高13位是描述符的索引值,用此值在GDT中索引描述符,前面说过GDT相当于一个描述符数组,所以此选择子中的索引值就是GDT中的下标
选择子的作用主要是确定段描述符,确定段描述的目的,一是为了特权级,权限等安全考虑,最主要的还是确认段的基地址
段基址在段描述符中,用给出的选择子缩影到描述符后,CPU自动从段描述符中取出段基址,这样再加上段内偏移地址,便凑成了段基址:段内偏移地址的形式
如图展示段描述符与内存段的关系
在这里插入图片描述
选择子的结构如图·所示:
在这里插入图片描述
需要注意的是GDT的第0个段描述符时不可用的,原因是定义在GDT中的段描述符是要用选择子来访问的,如果使用的选择子忘记初始化,选择子的值便会是0,这便会访问到第0个段描述符,为了避免出现这种因忘记初始化选择子而选择到第0个段描述符的情况,GDT中的第0个段描述符不可用
为了突破1MB内存的束缚,IBM在键盘控制器上的一些输出线来控制第21根地址(A20)的有效性,故被称为A20Gate

  • 如果A20Gate被打开,当访问到0x10000-0x10FFEF之间的地址时,CPU将真正访问这块物理内存
  • 如果A20Gate被禁用,当访问0x100000-0x10FFEF之间的地址时,CPU将采用8086/8088的地址回绕

打开A20Gate的方式是及其简单的,将端口0x92的第一位置1就可以了

保护模式的开关,CR0寄存器的PE位

控制寄存器是CPU的窗口,既可以用来展示CPU的内部控制,也可用于控制CPU的运行机制,我们将用到CR0寄存器的第0位,即PE位,此位用于启动保护模式,是保护模式的开关,当打开此位后,CPU才真正进入保护模式

进入保护模式

boot.inc文件,里面是一些配置信息,loader.S中用到的配置都是定义在boot.inc中的符号

;-------------	 loader和kernel   ----------

LOADER_BASE_ADDR equ 0x900 
LOADER_START_SECTOR equ 0x2

;--------------   gdt描述符属性  -------------
DESC_G_4K   equ	  1_00000000000000000000000b   
DESC_D_32   equ	   1_0000000000000000000000b
DESC_L	    equ	    0_000000000000000000000b	;  64位代码标记,此处标记为0便可。
DESC_AVL    equ	     0_00000000000000000000b	;  cpu不用此位,暂置为0  
DESC_LIMIT_CODE2  equ 1111_0000000000000000b
DESC_LIMIT_DATA2  equ DESC_LIMIT_CODE2
DESC_LIMIT_VIDEO2  equ 0000_000000000000000b
DESC_P	    equ		  1_000000000000000b
DESC_DPL_0  equ		   00_0000000000000b
DESC_DPL_1  equ		   01_0000000000000b
DESC_DPL_2  equ		   10_0000000000000b
DESC_DPL_3  equ		   11_0000000000000b
DESC_S_CODE equ		     1_000000000000b
DESC_S_DATA equ	  DESC_S_CODE
DESC_S_sys  equ		     0_000000000000b
DESC_TYPE_CODE  equ	      1000_00000000b	;x=1,c=0,r=0,a=0 代码段是可执行的,非依从的,不可读的,已访问位a清0.  
DESC_TYPE_DATA  equ	      0010_00000000b	;x=0,e=0,w=1,a=0 数据段是不可执行的,向上扩展的,可写的,已访问位a清0.

DESC_CODE_HIGH4 equ (0x00 << 24) + DESC_G_4K + DESC_D_32 + DESC_L + DESC_AVL + DESC_LIMIT_CODE2 + DESC_P + DESC_DPL_0 + DESC_S_CODE + DESC_TYPE_CODE + 0x00
DESC_DATA_HIGH4 equ (0x00 << 24) + DESC_G_4K + DESC_D_32 + DESC_L + DESC_AVL + DESC_LIMIT_DATA2 + DESC_P + DESC_DPL_0 + DESC_S_DATA + DESC_TYPE_DATA + 0x00
DESC_VIDEO_HIGH4 equ (0x00 << 24) + DESC_G_4K + DESC_D_32 + DESC_L + DESC_AVL + DESC_LIMIT_VIDEO2 + DESC_P + DESC_DPL_0 + DESC_S_DATA + DESC_TYPE_DATA + 0x0b

;--------------   选择子属性  ---------------
RPL0  equ   00b
RPL1  equ   01b
RPL2  equ   10b
RPL3  equ   11b
TI_GDT	 equ   000b
TI_LDT	 equ   100b

loader.S文件

  %include "boot.inc"
   section loader vstart=LOADER_BASE_ADDR
   LOADER_STACK_TOP equ LOADER_BASE_ADDR
   jmp  near loader_start 					; 此处的物理地址是:
   
;构建gdt及其内部的描述符
   GDT_BASE:   dd    0x00000000 
	       dd    0x00000000

   CODE_DESC:  dd    0x0000FFFF 
	       dd    DESC_CODE_HIGH4

   DATA_STACK_DESC:  dd    0x0000FFFF
		     dd    DESC_DATA_HIGH4

   VIDEO_DESC: dd    0x80000007	       ;limit=(0xbffff-0xb8000)/4k=0x7
	       dd    DESC_VIDEO_HIGH4  ; 此时dpl已改为0

   GDT_SIZE   equ   $ - GDT_BASE
   GDT_LIMIT   equ   GDT_SIZE -	1 
  
   dq 50 dup(0)             ;不能预留 60个 ,60 * 8B 太大了(只有1M内存),50可以运行正常。
    ; times 60 dq 0					 ; 此处预留60个描述符的slot
   SELECTOR_CODE equ (0x0001<<3) + TI_GDT + RPL0         ; 相当于(CODE_DESC - GDT_BASE)/8 + TI_GDT + RPL0
   SELECTOR_DATA equ (0x0002<<3) + TI_GDT + RPL0	 ; 同上
   SELECTOR_VIDEO equ (0x0003<<3) + TI_GDT + RPL0	 ; 同上 

   ;以下是定义gdt的指针,前2字节是gdt界限,后4字节是gdt起始地址

   gdt_ptr  dw  GDT_LIMIT 
	    dd  GDT_BASE
   loadermsg db '2 loader in real.'

loader_start:

;------------------------------------------------------------
;INT 0x10    功能号:0x13    功能描述:打印字符串
;------------------------------------------------------------
;输入:
;AH 子功能号=13H
;BH = 页码
;BL = 属性(若AL=00H或01H)
;CX=字符串长度
;(DH、DL)=坐标(行、列)
;ES:BP=字符串地址 
;AL=显示输出方式
;   0——字符串中只含显示字符,其显示属性在BL中。显示后,光标位置不变
;   1——字符串中只含显示字符,其显示属性在BL中。显示后,光标位置改变
;   2——字符串中含显示字符和显示属性。显示后,光标位置不变
;   3——字符串中含显示字符和显示属性。显示后,光标位置改变
;无返回值
     
   mov	 sp, LOADER_BASE_ADDR
   mov	 bp, loadermsg           ; ES:BP = 字符串地址
   mov	 cx, 17			 ; CX = 字符串长度
   mov	 ax, 0x1301		 ; AH = 13,  AL = 01h
   mov	 bx, 0x001f		 ; 页号为0(BH = 0) 蓝底粉红字(BL = 1fh)
   mov	 dx, 0x1800		 ;
   int	 0x10                    ; 10h 号中断

;----------------------------------------   准备进入保护模式   ------------------------------------------
									;1 打开A20
									;2 加载gdt
									;3 将cr0的pe位置1


   ;-----------------  打开A20  ----------------
   in al,0x92
   or al,0000_0010B
   out 0x92,al

   ;-----------------  加载GDT  ----------------
   lgdt [gdt_ptr]


   ;-----------------  cr0第0位置1  ----------------
   mov eax, cr0
   or eax, 0x00000001
   mov cr0, eax
   

   ;jmp dword SELECTOR_CODE:p_mode_start	     ; 刷新流水线,避免分支预测的影响,这种cpu优化策略,最怕jmp跳转,
   jmp  dword SELECTOR_CODE:p_mode_start	     ; 刷新流水线,避免分支预测的影响,这种cpu优化策略,最怕jmp跳转,
					     ; 这将导致之前做的预测失效,从而起到了刷新的作用。

[bits 32]
p_mode_start:
   mov ax, SELECTOR_DATA
   mov ds, ax
   mov es, ax
   mov ss, ax
   mov esp,LOADER_STACK_TOP
   mov ax, SELECTOR_VIDEO
;    mov gs, ax

   mov byte [gs:160], 'P'

   jmp $

编译:

nasm -I include/ -o mbr.bin mbr.S
nasm -I include/ -o loader.bin loader.S

复制到硬盘:

dd if=./mbr.bin of=hd60M.img bs=512 count=1 conv=notrunc
dd if=./loader.bin of=hd60M.img bs=512 count=4 seek=2 conv=notrunc

最后的效果为:
在这里插入图片描述

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值