我的汇编学习——基础知识(2-寄存器)

寄存器


一个典型的CPU(此处讨论的不是某一具体的CPU)由 运算器控制器寄存器(CPU工作原理)等器件构成, 这些器件靠内部总线相连。前一章所说的总线,相对于CPU内部来说是外部总线。 内部总线实现CPU内部各个器件之间的联系,外部总线实现CPU和主
板上其他器件的联系。
简单地说,在CPU中:

  • 运算器进行信息处理;
  • 寄存器进行信息存储:;
  • 控制器控制各种器件进行工作;
  • 内部总线连接各种器件,在它们之间进行数据的传送。

对于一个汇编程序员来说,CPU中的主要部件是寄存器。寄存器是CPU中程序员可以用指令读写的部件。程序员通过改变各种寄存器中的内容来实现对CPU的控制。

不同的CPU,寄存器的个数、结构是不相同的。8086CPU 有14 个寄存器,每个寄存器有一个名称。这些寄存器是: AX、BX、CX、DX、SI、DI、SP、BP、IP、CS、SS、DS、ES、PSW。

1.通用寄存器

8086CPU的所有寄存器都是16位的,可以存放两个字节。 AX、BX、CX、DX这4个寄存器通常用来存放一般性的数据,被称为通用寄存器。以AX为例,寄存器的逻辑结构如图2.1所示。
在这里插入图片描述
一个16位寄存器可以存储一个 16位的数据,数据在寄存器中的存放情况如图2.2所示。

8086CPU的AX、BX、CX、DX这4个寄存器都可分为两个可独立使用的8位寄存器来用:

  • AX可分为AH和AL;
  • BX可分为BH和BL;
  • CX可分为CH和CL;
  • DX可分为DH和DL。
    在这里插入图片描述
    以AX为例,8086CPU的16位寄存器分为两个8位寄存器的情况如图2.3所示。
    在这里插入图片描述
    AX的低8位(0位—7位)构成了AL寄存器,高8位(8位—15位)构成了AH寄存器。AH和AL寄存器是可以独立使用的8位寄存器。图2.4展示了16位寄存器及它所分成的两个8位寄存器的数据存储的情况。
    在这里插入图片描述

2.字在寄存器中的存储

出于对兼容性的考虑,8086CPU可以一次性处理以下两种尺寸的数据。

  • 字节:记为byte,一个字节由8个bit组成,可以存在8位寄存器中。
  • 字:记为word,一个字由两个字节组成,这两个字节分别称为这个字的高位字节和低位字节,如图2.5所示。
    在这里插入图片描述
    一个字可以存在一个16位寄存器中,这个字的高位字节和低位字节自然就存在这个寄存器的高8位寄存器和低8位寄存器中。 如图2.4 所示,一个字型数据20000, 存在AX寄存器中,在AH中存储了它的高8位,在AL中存储了它的低8位。AH和AL中的数据,既可以看成是一个 字型数据 的高8位和低8位,这个 字型数据 的大小是20000;又可以看成是两个独立的 字节型 数据,它们的大小分别是78和32。

3.几条汇编指令

在这里插入图片描述
在写一条汇编指令或一一个寄存器的名称时不区分大小写。如: mov ax,18和MOV AX,18的含义相同;bx 和BX的含义相同。

接下来看一下CPU执行表2.2中所列的程序段中的每条指令后,对寄存器中的数据进行的改变。
在这里插入图片描述
问题2.1
分析:
程序段中的最后一条指令add ax,bx,在执行前ax和bx中的数据都为8226H,相加后所得的值为:1044CH,但是ax为16位寄存器,只能存放4位十六进制的数据,所以最高位的1不能在ax中保存,ax 中的数据为: 044CH。

表2.3中所列的一段程序的执行情况。
在这里插入图片描述
问题2.2
分析:
程序段中的最后一条指令 add al,93H,在执行前,al 中的数据为C5H,相加后所得的值为: 158H, 但是al为8位寄存器,只能存放两位十六进制的数据,所以最高位的1丢失,ax中的数据为: 0058H。 (这里的丢失,指的是进位值不能在8位寄存器中保存,但是CPU并不真的丢弃这个进位值。)

注意,此时al是作为一一个独立的8位寄存器来使用的,和ah没有关系,CPU在执行这条指令时认为ah和al是两个不相关的寄存器。不要错误地认为,诸如add al,93H的指令产生的进位会存储在ah中,add al,93H进行的是8位运算。

如果执行add ax,93H,低8位的进位会存储在ah中,CPU在执行这条指令时认为只有一个16位寄存器ax,进行的是16位运算。指令add ax,93H执行后,ax中的值为:0158H。此时,使用的寄存器是16位寄存器ax,add ax,93H 相当于将ax中的16位数据00c5H和另一个16位数据0093H相加,结果是16位的0158H。

在进行数据传送或运算时,要注意指令的两个操作对象的位数应当是一致的。

4.物理地址

我们知道,CPU访问内存单元时,要给出内存单元的地址。所有的内存单元构成的存储空间是一个一维的线性空间,每一个内存单元在这个空间中都有唯一的地址, 我们将这个唯一的地址称为物理地址。

CPU通过地址总线送入存储器的,必须是一个内存单元的物理地址。 在CPU向地址总线上发出物理地址之前,必须要在内部先形成这个物理地址。不同的CPU可以有不同的形成物理地址的方式。我们现在讨论8086CPU是如何在内部形成内存单元的物理地址的。

5.16位结构的CPU

概括地讲,16 位结构描述了一个CPU具有下面几方面的结构特性。

  • 运算器一次最多可以处理16位的数据;
  • 寄存器的最大宽度为16位;
  • 寄存器和运算器之间的通路为16位。

8086是16 位结构的CPU,这也就是说,在8086内部,能够一次性处理、传输、暂时存储 的信息的最大长度是16 位的。内存单元的地址在送上地址总线之前,必须在CPU中处理、传输、暂时存放,对于16位CPU,能一次性处理、传输、暂时存储16位的地址。

6.8086CPU给出物理地址的方法

8086CPU有20位地址总线,可以传送20位地址,达到1MB寻址能力。但8086CPU又是16位结构,在内部一次性处理、 传输、暂时存储的地址为16 位。从8086CPU的内部结构来看,如果将地址从内部简单地发出,那么它只能送出16 位的地址,表现出的寻址能力只有64KB。

8086CPU采用一种在内部用两个16位地址合成的方法来形成一个 20位的物理地址。
8086CPU相关部件的逻辑结构如图2.6所示。
在这里插入图片描述
如图2.6所示,当8086CPU要读写内存时:

  • (1)CPU 中的相关部件提供两个16位的地址,一个称为段地址,另一个称为偏移地址;
  • (2)段地址和偏移地址通过内部总线送入一个称为地址加法器的部件;
  • (3)地址加法器将两个16位地址合成为一个20位的物理地址;
  • (4)地址加法器通过内部总线将20位物理地址送入 输入输出控制电路;
  • (5)输入输出控制电路将20位物理地址送上地址总线;
  • (6)20位物理地址被地址总线传送到存储器。

地址加法器采用 物理地址=段地址x16+偏移地址 的方法用段地址和偏移地址合成物理地址。例如,8086CPU 要访问地址为123C8H 的内存单元,此时,地址加法器的工作过程如图2.7所示(图中数据皆为十六进制表示)。
在这里插入图片描述

7.“段地址x16+偏移地址=物理地址” 的本质含义

“段地址x16+偏移地址=物理地址” 的本质含义是:CPU在访问内存时,用一个基础地址(段地址x16)和一个相对于基础地址的偏移地址相加,给出内存单元的物理地址
8086CPU中,段地址x16可看作是基础地址。

8.段的概念

段,并不是说内存中真的被划分为了一个一个的段,每个段有一个段地址。我们只是用分段的方式来管理内存。
其实,内存并没有分段,段的划分来自于CPU,由于8086CPU 用“基础地址(段地址x16)+偏移地址=物理地址”的方式给出内存单元的物理地址,使得我们可以用分段的方式来管理内存。如图2.9所示,我们可以认为:地址10000H—100FFH 的内存单元组成一个段,该段的起始地址(基础地址)10000H, 段地址为1000H, 大小为100H;我们也可以认为地址10000H~ 1007FH、10080H~100FFH 的内存单元组成两个段,它们的起始地址(基础地址)为:10000H和10080H, 段地址为:1000H和1008H, 大小都为80H。
在这里插入图片描述
以后,在编程时可以根据需要,将若干地址连续的内存单元看作一个段,用段地址x16定位段的起始地址(基础地址),用偏移地址定位段中的内存单元。

9.段寄存器

我们前面讲到,8086CPU在访问内存时要由相关部件提供内存单元的段地址和偏移地址,送入地址加法器合成物理地址。这里,需要看一下,是什么部件提供段地址。段地址在8086CPU的段寄存器中存放。8086CPU有4个段寄存器: CS、DS、SS、ES。当8086CPU要访问内存时由这4个段寄存器提供内存单元的段地址。 本章中只看一下CS。

10.CS和IP

CS和IP是8086CPU中两个最关键的寄存器,它们指示了CPU 当前要读取指令的地址 。CS为代码段寄存器,IP 为指令指针寄存器,从名称上我们可以看出它们和指令的关系。

在8086PC机中,任意时刻,设CS中的内容为M,IP 中的内容为N,那么8086CPU 将从内存Mx16+N单元开始,读取一条指令并执行。

也可以这样表述:8086 机中,任意时刻,CPU将CS:IP指向的内容当作指令执行。 图2.10展示了8086CPU读取、执行指令的工作原理(图中只包括了和所要说明的问题密切相关的部件,图中数字都为十六进制)。
在这里插入图片描述
图2.10说明如下。
(1) 8086CPU 当前状态: CS中的内容为2000H,IP 中的内容为0000H; .
(2)内存20000H~20009H单元存放着可执行的机器码;
(3)内存20000H~20009H单元中存放的机器码对应的汇编指令如下。

地址: 20000H~20002H,内容: B8 2301,长度: 3Byte, 对应汇编指令: mov ax,0123H
地址: 20003H~20005H, 内容: BB 0300,长度: 3Byte, 对应汇编指令: mov bx,0003H
地址: 20006H~20007H, 内容: 89 D8,长度: 2Byte, 对应汇编指令: mov ax,bx
地址: 20008H~20009H, 内容: 01 D8,长度: 2Byte, 对应汇编指令: add ax,bx

下面的一组图(图2.11~图2.19),以图2.10描述的情况为初始状态,展示了8086CPU读取、执行一条指令的过程。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
通过上面的过程展示,8086CPU 的工作过程可以简要描述如下。

(1)从CS:IP指向的内存单元读取指令,读取的指令进入指令缓冲器;
(2) IP=IP+所读取指令的长度, 从而指向下一条指令;
(3)执行指令。转到步骤(1),重复这个过程。

在8086CPU 加电启动或复位后(即CPU刚开始工作时)CS和IP被设置为CS=FFFFH,IP=0000H, 即在8086PC机刚启动时,CPU从内存FFFF0H单元中读取指令执行,FFFF0H单元中的指令是8086PC机开机后执行的第一条指令。
现在,我们更清楚了CS和IP的重要性,它们的内容提供了CPU要执行指令的地址。

在第1章中讲过,在内存中,指令和数据没有任何区别,都是二进制信息,CPU在工作的时候把有的信息看作指令,有的信息看作数据。现在,如果提出一一个问题:CPU根据什么将内存中的信息看作指令?
我们可以说,CPU 将CS:IP指向的内存单元中的内容看作指令,因为,在任何时候,CPU 将CS、IP中的内容当作指令的段地址和偏移地址,用它们合成指令的物理地址,到内存中读取指令码,执行。 如果说,内存中的一段信息曾被CPU执行过的话,那么,它所在的内存单元必然被CS:IP指向过。

11.修改CS、IP的指令

可以通过改变寄存器中的内容实现对CPU的控制。CPU从何处执行指令是由CS、IP 中的内容决定的,所以可以通过改变CS、IP 中的内容来控制CPU执行目标指令。

如何改变CS、IP的值呢?显然,8086CPU 必须提供相应的指令。我们如何修改AX中的值?可以用mov指令,如mov ax,123 将ax中的值设为123,显然,我们也可以用同样的方法设置其他寄存器的值,如mov bx,123,mov cx,123,movdx, 123 等。其实,8086CPU大部分寄存器的值,都可以用mov指令来改变,mov 指令被称为传送指令。

但是,mov指令偏偏不能用于设置CS、IP的值,原因很简单,因为8086CPU没有提供这样的功能。8086CPU 为CS、IP 提供了另外的指令来改变它们的值。能够改变CS、IP的内容的指令被统称为 转移指令。我们现在介绍一个最简单的可以修改CS、IP 的指令:jmp指令

若想同时修改CS、IP的内容,可用形如“ jmp段地址:偏移地址 ”的指令完成,如jmp 2AE3:3,执行后:CS=2AE3H,IP=0003H, CPU将从2AE33H处读取指令。jmp 3:0B16,执行后: CS=0003H,IP=0B16H,CPU将从00B46H处读取指令。

“ jmp段地址:偏移地址 ” 指令的功能为:用指令中给出的段地址修改CS,偏移地址修改IP。

若想仅修改IP的内容,可用形如“ jmp 某一合法寄存器 ”的指令完成(用这一合法寄存器中的内容覆盖IP中的内容),如:
jmp ax,指令执行前:ax=1000H, CS=2000H, IP=0003H
指令执行后: ax=1000H, CS= 2000H,IP= 1000H
jmp bx,指令执行前: bx=0B16H, CS=2000H,IP=0003H
指令执行后: bx=0B16H, CS= =2000H,IP=0B16H

“jmp 某一合法寄存器”指令的功能为:用寄存器中的值修改IP。
jmp ax,在含义上好似: mov IP,ax。

12.代码段

前面讲过,对于8086PC 机,在编程时,可以根据需要,将一组内存单元定义为一个段。我们可以将长度为N(N≤64KB)的一组代码,存放在一组地址连续、起始地址为16的倍数的内存单元中,我们可以认为,这段内存是用来存放代码的,从而定义了一个代码段。 比如,将:
在这里插入图片描述
这段长度为10个字节的指令,存放在123B0H~123B9H的一组内存单元中,我们就可以认为,123B0H—123B9H 这段内存是用来存放代码的,是一个代码段,它的 段地址 为123BH,长度为10个字节。

如何使得代码段中的指令被执行呢?将一段内存当作代码段,仅仅是我们在编程时的一种安排,CPU并不会由于这种安排,就自动地将我们定义的代码段中的指令当作指令来执行。CPU只认被CS:IP指向的内存单元中的内容为指令。所以,要让CPU执行我们放在代码段中的指令,必须要将CS:IP指向所定义的代码段中的第一条指令的首地址。对于上面的例子,我们将一段代码存放在123B0H~123B9H 内存单元中,将其定义为代码段,如果要让这段代码得到执行,可设CS=123BH、IP=0000H。

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值