【Linux 0.11】IA-CPU

最新推荐文章于 2023-04-06 22:58:18 发布

JettHuang

最新推荐文章于 2023-04-06 22:58:18 发布

阅读量1.2k

点赞数

分类专栏： Linux Kernel 文章标签： linux 任务 descriptor 存储扩展汇编

本文链接：https://blog.csdn.net/huangzhipeng/article/details/6127940

版权

Linux Kernel 专栏收录该内容

7 篇文章 0 订阅

订阅专栏

1. 寄存器

2. 实模式 VS 保护模式

实模式和保护模式均使用分段机制，保护模式的机制更加完备。

3. 保护模式下的编程

1). 存储段描述符

P位称为存在(Present)位。P=1表示描述符对地址转换是有效的，或者说该描述符所描述的段存在，即在内存中；P=0表示描述符对地址转换无效，即该段不存在。使用该描述符进行内存访问时会引起异常。
DPL表示描述符特权级(Descriptor Privilege level)，共2位。它规定了所描述段的特权级，用于特权检查，以决定对该段能否访问。
DT位说明描述符的类型。对于存储段描述符而言，DT=1，以区别与系统段描述符和门描述符(DT=0)。
TYPE说明存储段描述符所描述的存储段的具体属性：

其中的位0指示描述符是否被访问过(Accessed)，用符号A标记。A=0表示尚未被访问，A=1 表示段已被访问。当把描述符的相应选择子装入到段寄存器时，80386把该位置为1，表明描述符已被访问。操作系统可测试访问位，已确定描述符是否被访问过。
其中的位3指示所描述的段是代码段还是数据段，用符号E标记。E=0表示段为数据段，相应的描述符也就是数据段(包括堆栈段)描述符。数据段是不可执行的，但总是可读的。 E=1表示段是可执行段，即代码段，相应的描述符就是代码段描述符。代码段总是不可写的，若需要对代码段进行写入操作，则必须使用别名技术，即用一个可写的数据段描述符来描述该代码段，然后对此数据段进行写入。
在数据段描述符中(E=0的情况)，TYPE中的位1指示所描述的数据段是否可写，用W标记。 W=0表示对应的数据段不可写。反之，W=1表示数据段是可写的。注意，数据段总是可读的。TYPE中的位2是ED位，指示所描述的数据段的扩展方向。ED=0表示数据段向高端扩展，也即段内偏移必须小于等于段界限。ED=1表示数据段向低扩展，段内偏移必须大于段界限。
在代码段描述符中(E=1的情况)，TYPE中的位1指示所描述的代码段是否可读，用符号R标记。R=0表示对应的代码段不可读，只能执行。R=1表示对应的代码段可读可执行。注意代码段总是不可写的，若需要对代码段进行写入操作，则必须使用别名技术。在代码段中，TYPE中的位2指示所描述的代码段是否是一致代码段，用C标记。C=0表示对应的代码段不是一致代码段(普通代码段)，C=1表示对应的代码段是一致代码段。

G为就是段界限粒度(Granularity)位。G=0表示界限粒度为字节；G=1表示界限粒度为4K 字节。注意，界限粒度只对段界限有效，对段基地址无效，段基地址总是以字节为单位。
D位是一个很特殊的位，在描述可执行段、向下扩展数据段或由SS寄存器寻址的段(通常是堆栈段)的三种描述符中的意义各不相同。

在描述可执行段的描述符中，D位决定了指令使用的地址及操作数所默认的大小。D=1表示默认情况下指令使用32位地址及32位或8位操作数，这样的代码段也称为32位代码段；D=0 表示默认情况下，使用16位地址及16位或8位操作数，这样的代码段也称为16位代码段，它与80286兼容。可以使用地址大小前缀和操作数大小前缀分别改变默认的地址或操作数的大小。
在向下扩展数据段的描述符中，D位决定段的上部边界。D=1表示段的上部界限为4G；D=0表示段的上部界限为64K，这是为了与80286兼容。
在描述由SS寄存器寻址的段描述符中，D位决定隐式的堆栈访问指令(如PUSH和POP指令)使用何种堆栈指针寄存器。D=1表示使用32位堆栈指针寄存器ESP；D=0表示使用16位堆栈指针寄存器SP，这与80286兼容。

AVL位是软件可利用位。80386对该位的使用未左规定，Intel公司也保证今后开发生产的处理器只要与80386兼容，就不会对该位的使用做任何定义或规定。
Byte6的bit5必须为0.

【段界的计算】

段界指的是能够最大访问的一个字节地址, G=0时，limit = Limit; G=1时，limit = Limit * 4K + 0x0FFF.

2). 系统段描述符

在80386中，有两种系统段：任务状态段TSS和局部描述符表LDT段。

从上图可见，只有类型编码为2、1、3、9和B的描述符才是真正的系统段描述符，它们用于描述系统段LDT和任务状态段TSS，其它类型的描述符是门描述符。利用前文定义的存储段描述符结构类型DESC仍能方便地在程序中说明系统段描述符。需要注意的是，系统段描述符的选择子不能用来读写系统段，要想读写系统段，必须使用别名技术。

3). 门描述符

除存储段描述符和系统段描述符外，还有一类门描述符。门描述符并不描述某种内存段，而是描述控制转移的入口点。这种描述符好比一个同向另一代码段的门。通过这种门，可实现任务内特权级的变换和任务间的切换。所以，这种门描述符也称为控制门。

A.调用门

      调用门描述某个子程序的入口。调用门内的选择子必须实现代码段描述符，调用门内的偏移是对应代码段内的偏移。利用段间调用指令CALL，通过调用门可实现任务内从外层特权级变换到内层特权级。

       在上图所示的门描述符内偏移4字节的位0至位4是双字计数字段，该字段只在调用门描述符中有效，在其它门描述符中无效。主程序通过堆栈把入口参数传递给子程序，如果在利用调用门调用子程序时引起特权级的转换和堆栈的改变，那么就需要将外层堆栈中的参数复制到内层堆栈。该双字计数字段就是用于说明这种情况发生时，要复制的双字参数的数量。

B.任务门

       任务门指示任务。任务门内的选择子必须指示GDT中的任务状态段TSS描述符，门中的偏移无意义。任务的入口点保存在TSS中。利用段间转移指令JMP和段间调用指令CALL，通过任务门可实现任务切换。

C.中断门和陷阱门

       中断门和陷阱门描述中断/异常处理程序的人口点。中断门和陷阱门内的选择子必须指向代码段描述符，门内的偏移就是对应代码段的人口点的偏移。中断门和陷阱门只有在中断描述符表IDT中才有效。关于中断门和陷阱门的区别在于转移时对IF标识的处理：对于中断门，在转移过程中把IF置为0，使得在处理程序执行期间屏蔽掉INTR中断(当然，在中断处理程序中可以人为设置IF标志打开中断，以使得在处理程序执行期间允许响应可屏蔽中断)；对于陷阱门，在转移过程中保持IF位不变，即如果IF位原来是1，那么通过陷阱门转移到处理程序之后仍允许INTR中断。因此，中断门最适宜于处理中断，而陷阱门适宜于处理异常。

4). 任务状态段

       任务状态段(Task State Segment)是保存一个任务重要信息的特殊段。任务状态段描述符用于描述这样的系统段。任务状态段寄存器TR的可见部分含有当前任务的任务状态段描述符的选择子，TR的不可见的高速缓冲寄存器部分含有当前任务状态段的段基地址和段界限等信息。 TSS在任务切换过程中起着重要作用，通过它实现任务的挂起和恢复。所谓任务切换是指，挂起当前正在执行的任务，恢复或启动另一任务的执行。在任务切换过程中，首先，处理器中各寄存器的当前值被自动保存到TR所指定的TSS中；然后，下一任务的TSS的选择子被装入TR；最后，从TR所指定的TSS中取出各寄存器的值送到处理器的各寄存器中。由此可见，通过在TSS中保存任务现场各寄存器状态的完整映象，实现任务的切换。

任务状态段TSS的基本格式如下图所示。

1.寄存器保存区域

      寄存器保存区域位于TSS内偏移20H至5FH处，用于保存通用寄存器、段寄存器、指令指针和标志寄存器。当TSS对应的任务正在执行时，保存区域是未定义的；在当前任务被切换出时，这些寄存器的当前值就保存在该区域。当下次切换回原任务时，再从保存区域恢复出这些寄存器的值，从而，使处理器恢复成该任务换出前的状态，最终使任务能够恢复执行。从上图可见，各通用寄存器对应一个32位的双字，指令指针和标志寄存器各对应一个32位的双字；各段寄存器也对应一个32位的双字，段寄存器中的选择子只有16位，安排再双字的低16位，高16位未用，一般应填为0。

2.内层堆栈指针区域

       为了有效地实现保护，同一个任务在不同的特权级下使用不同的堆栈。例如，当从外层特权级3变换到内层特权级0时，任务使用的堆栈也同时从3级变换到0级堆栈；当从内层特权级0变换到外层特权级3时，任务使用的堆栈也同时从0级堆栈变换到3级堆栈。所以，一个任务可能具有四个堆栈，对应四个特权级。四个堆栈需要四个堆栈指针。

        TSS的内层堆栈指针区域中有三个堆栈指针，它们都是48位的全指针(16位的选择子和32位的偏移)，分别指向0级、1级和2级堆栈的栈顶，依次存放在TSS中偏移为4、12及20开始的位置。当发生向内层转移时，把适当的堆栈指针装入SS及ESP寄存器以变换到内层堆栈，外层堆栈的指针保存在内层堆栈中。没有指向3级堆栈的指针，因为3级是最外层，所以任何一个向内层的转移都不可能转移到3级。

但是，当特权级由内层向外层变换时，并不把内层堆栈的指针保存到TSS的内层堆栈指针区域。实际上，处理器从不向该区域进行写入，除非程序设计者认为改变该区域的值。这表明向内层转移时，总是把内层堆栈认为是一个空栈。因此，不允许发生同级内层转移的递归，一旦发生向某级内层的转移，那么返回到外层的正常途径是相匹配的向外层返回。

3.地址映射寄存器区域

       从虚拟地址空间到线性地址空间的映射由GDT和LDT确定，与特定任务相关的部分由LDT确定，而LDT又由LDTR确定。如果采用分页机制，那么由线性地址空间到物理地址空间的映射由包含页目录表起始物理地址的控制寄存器CR3确定。所以，与特定任务相关的虚拟地址空间到物理地址空间的映射由LDTR和CR3确定。显然，随着任务的切换，地址映射关系也要切换。

        TSS的地址映射寄存器区域由位于偏移1CH处的双字字段(CR3)和位于偏移60H处的字字段(LDTR)组成。在任务切换时，处理器自动从要执行任务的TSS中取出这两个字段，分别装入到寄存器CR3和LDTR。这样就改变了虚拟地址空间到物理地址空间的映射。但是，在任务切换时，处理器并不把换出任务但是的寄存器CR3和LDTR的内容保存到TSS中的地址映射寄存器区域。事实上，处理器也从来不向该区域自动写入。因此，如果程序改变了LDTR或CR3，那么必须把新值人为地保存到TSS中的地址映射寄存器区域相应字段中。可以通过别名技术实现此功能。

4.链接字段

       链接字段安排在TSS内偏移0开始的双字中，其高16位未用。在起链接作用时，地16位保存前一任务的TSS描述符的选择子。如果当前的任务由段间调用指令CALL或中断/异常而激活，那么链接字段保存被挂起任务的 TSS的选择子，并且标志寄存器EFLAGS中的NT位被置1，使链接字段有效。在返回时，由于NT标志位为1，返回指令RET或中断返回指令IRET将使得控制沿链接字段所指恢复到链上的前一个任务。

5.其它字段

       为了实现输入/输出保护，要使用I/O许可位图。任务使用的I/O许可位图也存放在TSS中，作为TSS的扩展部分。在TSS内偏移66H处的字用于存放I/O许可位图在TSS内的偏移(从TSS开头开始计算)。关于I/O许可位图的作用，将在I/O保护中介绍。

在TSS内偏移64H处的字是为任务提供的特别属性。在80386中，只定义了一种属性，即调试陷阱。该属性是字的最低位，用T表示。该字的其它位置被保留，必须被置为0。在发生任务切换时，如果进入任务的T位为1，那么在任务切换完成之后，新任务的第一条指令执行之前产生调试陷阱。

5). 控制转移

    指令JMP、CALL和RET都具有段间转移的功能，指令INT和IRET总是段间转移。此外，中断/异常也将引起段间转移。

6). 中断和异常

A. 中断

         对80386而言，中断是由异步的外部事件引起的。外部事件及中断响应与正执行的指令没有关系。通常，中断用于指示I/O设备的一次操作已完成。与8086/8088一样，80386有两根引脚INTR和NMI接受外部中断请求信号。INTR接受可屏蔽中断请求。NMI接受不可屏蔽中断请求。

B.异常

       异常是80386在执行指令期间检测到不正常的或非法的条件所引起的。异常与正执行的指令有直接的联系。例如，执行除法指令时，除数等于0。再如，执行指令时发现特权级不正确。当发生这些情况时，指令就不能成功完成。软中断指令“INT n”和“INTO”也归类于异常而不称为中断，这是因为执行这些指令产生异常事件。根据引起异常的程序是否可被恢复和恢复点不同，把异常进一步分类为故障(Fault)、陷阱(Trap)和中止(Abort)。

故障: 是在引起异常的指令之前，把异常情况通知给系统的一种异常。80386认为故障是可排除的。当控制转移到故障处理程序时，所保存的断点CS及EIP的值指向引起故障的指令。这样，在故障处理程序把故障排除后，执行IRET返回到引起故障的程序继续执行时，刚才引起故障的指令可重新得到执行。

陷阱:   是在引起异常的指令之后，把异常情况通知给系统的一种异常。当控制转移到异常处理程序时，所保存的断点CS及EIP的值指向引起陷阱的指令的下一条要执行的指令。下一条要执行的指令，不一定就是下一条指令。

中止:   是在系统出现严重情况时，通知系统的一种异常。引起中止的指令是无法确定的。产生中止时，正执行的程序不能被恢复执行。系统接收中止后，处理程序要重新建立各种系统表格，并可能重新启动操作系统。

7). I/O保护

I/O许可位图

      如果只用IOPL限制I/O指令的执行是很不方便的，不能满足实际要求需要。因为这样做会使得在特权级3执行的应用程序要么可访问所有I/O地址，要么不可访问所有I/O地址。实际需要与此刚好相反，只允许任务甲的应用程序访问部分I/O地址，只允许任务乙的应用程序访问另一部分I/O地址，以避免任务甲和任务乙在访问I/O地址时发生冲突，从而避免任务甲和任务乙使用使用独享设备时发生冲突。

       因此，在IOPL的基础上又采用了I/O许可位图。I/O许可位图由二进制位串组成。位串中的每一位依次对应一个I/O地址，位串的第0位对应I/O地址0，位串的第n位对应I/O地址n。如果位串中的第m位为0，那么对应的I/O地址m可以由在任何特权级执行的程序访问；否则对应的I/O地址m只能由在IOPL特权级或更内层特权级执行的程序访问。如果在I/O外层特权级执行的程序访问位串中位值为1的位所对应的I/O地址，那么将引起通用保护异常。

8). 特权指令

特权指令是指保护方式下只有当前特权级CPL=0时，才可执行的指令。如果CPL不等于0而执行它们，那么会引起通用保护异常。

4. 开启分页管理(保护模式下)

CPU寻址流程如下：

页目录项和页表项的格式

5. 16位代码 VS 32位代码

无论是在实模式下还是在保护模式下，均可以执行16bit or 32bit代码，只是需要prefix code 对指令进行重定义。如存储段描述符一节中所述：D=1表示默认情况下指令使用32位地址及32位或8位操作数，这样的代码段也称为32位代码段；D=0 表示默认情况下，使用16位地址及16位或8位操作数，这样的代码段也称为16位代码段，它与80286兼容。可以使用地址大小前缀和操作数大小前缀分别改变默认的地址或操作数的大小。

在使用汇编器的时候，有时候需要告诉汇编器某个代码段编译成16位的还是32位的。下面想从机器码的角度学习:

http://www.luocong.com/learningopcode/index.htm