目录
前言
一个典型的CPU由计算器、控制器、寄存器等器件构成,这些器件靠内部总线相连
简单来说,在CPU中:
- 运算器进行信息处理
- 寄存器进行信息存储
- 控制器控制各种器件进行工作
- 内部总线连接各种器件,在它们之间进行数据的传送
不同的CPU,寄存器的个数、结构是不相同的。8086CPU有14个寄存器,每个寄存器有一个名称。这些寄存器是:AX、BX、CX、DX、SI、DI、SP、BP、IP、CS、SS、DS、ES、PSW
通用寄存器:AX、BX、CX、DX
代码段寄存器:CS
指令指针寄存器:IP
地址段寄存器:DS
栈顶段地址寄存器:SS
栈顶偏移地址寄存器:SP
变址寄存器:SI、DI
标志寄存器:PSW
目标空间段地址寄存器:ES
8086是16位结构的CPU,16位结构用于表述一个CPU有以下几方面的结构特性:
- 运算器一次最多可以处理16位的数据
- 寄存器的最大宽度为16位
- 寄存器和运算器之间的通路为16位
所以8086CPU中所有寄存器都是16位,可以存放两个字节,但出于对兼容性的考虑,8086CPU可以一次性处理以下两种单位的数据:
- 字节:记为byte,一个字节由8个bit组成,可以存储在8位寄存器中
- 字:记为word,一个字由两个字节组成,这两个字节分别称为这个字的高位字节和低位字节
寄存器 | 寄存器中的数据 | 所表示的值 |
AX | 100111000100000 | 20000(4E20H) |
AH | 01001110 | 78(4EH) |
AL | 00100000 | 32(20H) |
在内存中存储时,由于内存单元是字节单元,所以一个字要用两个地址连续的内存单元来存放
字单元:即存放一个字形数据(16位)的内存单元,由两个地址连续的内存单元组成。高地址内存单元单元存放字形数据的高位字节,低地址内存单元中存放字形数据的低位字节
0地址单元中存放的字节型数据为20H
0地址单元中存放的字形数据为4E20H
物理地址
CPU访问内存单元时,要给出内存单元的地址,而所有内存单元构成的存储空间是一个一维的线性空间,所以每个内存单元在这个空间的地址都是唯一的,而这个唯一的地址称为物理地址
8086CPU中的地址加法器采用物理地址=段地址×16+偏移地址的方法用段地址和偏移地址合成物理地址
“物理地址=段地址×16+偏移地址”的本质含义是:CPU在访问内存时,用一个基础地址(段地址×16)和一个相对于基础地址的偏移地址相加,给出内存单元的物理地址
8086CPU有20位地址总线,可以传输20位地址,达到1MB的寻址能力,但由于它是16位结构,在内部一次性处理、传输、暂时存储的地址为16位,因此表现出的寻址能力只有64KB
其内部采用两个16位地址(段地址+偏移地址)合成一个20位物理地址的方法
8086CPU读写内存过程:
1、CPU中的相关部件提供两个16位的地址,一个称为段地址,另一个称为偏移地址
2、段地址和偏移地址通过内部总线送入一个称为地址加法器的部件
3、地址加法器将两个16位地址合成一个20位的物理地址
4、地址加法器通过内部总线将物理地址送入输入输出控制电路
5、输入输出控制电路将物理地址送上地址总线
6、地址总线将物理地址送入内存
CPU可以用不同的段地址和偏移地址形成同一个物理地址
偏移地址16位,变化范围为0~FFFFH,仅用偏移地址来寻址最多可寻64KB个内存单元
通用寄存器:AX、BX、CX、DX
AX、BX、CX、DX这4个寄存器通常用来存放一般性的数据,被称为通用寄存器
以AX为例,寄存器的逻辑如下图所示
一个16位寄存器可以存放一个16位的数据
由于8086CPU的上一代CPU为8位寄存器,所以为了保证兼容,使原来基于上代CPU编写的程序稍加修改就能运行在8086CPU上,8086CPU的AX、BX、CX、DX这四个寄存器都可分为两个可独立使用的8位寄存器
- AX可分为AH和AL
- BX可分为BH和BL
- CX可分为CH和CL
- DX可分为DH和DL
以AX为例,8086CPU的16位寄存器分为两个8位寄存器的情况如下图
AX的低八位(0位~7位)构成了AL寄存器,高八位(8位~15位)构成了AH寄存器
AH和AL寄存器都是可以单独使用的8位寄存器
指令相关寄存器:CS和IP
CS和IP是8086CPU中最关键的两个寄存器,它们指示了CPU当前要读取指令的地址
CS为代码段寄存器,IP为指令指针寄存器
在内存中,指令和数据没有区别,都是二进制信息,所以CPU是根据CS:IP来判断该内存中的信息是否为指令,即CPU将CS:IP指向的内存单元中的内容看做指令
修改CS和IP的值需要用到:jmp指令(转移指令)
- 修改CS和IP:jmp 段地址:偏移地址
- 修改IP:jmp 某一合法寄存器
第一步:当CPU读取指令时,会从CS:IP指向的内存单元读取指令,读取的指令进入指令缓存器
第二步:IP=IP+所读取指令的长度,从而指向下一条指令
第三步:执行指令。转到第一步,重复此过程
在8086CPU加电启动或复位时,CS和IP被设置为CS=FFFFH,IP=0000H,即在8086PC机刚启动时,CPU会从内存FFFF0H单元中读取指令(开机后执行的第一条指令)执行
地址段寄存器:DS
内存地址由段地址和偏移地址组成,8086CPU中有一个DS寄存器,通常用来存放要访问数据的段地址
8086CPU自动取DS中的数据为内存单元的段地址,需要注意的是8086CPU不支持数据直接送入段寄存器的操作
比如我们要读取10000H单元的内容,可使用以下程序段来进行
- mov bx,1000H
- mov ds,bx
- mov al,[0]
mov指令中的[]说明操作对象是一个内存单元,如果第三步改为mov ax,[0]则表示传送的是字形数据,即ax的ah传入10001H单元的内容,al传入10000单元的内容
栈和栈顶段寄存器SS和寄存器SP
栈是一种具有特殊的访问方式的存储器,它的特殊性在于,最后进入这个空间的数据,最先出去
栈有两个基本的操作:入栈和出栈
- 入栈:将一个新的元素放到栈顶
- 出栈:从栈顶取出一个元素
栈的这种操作规则被称为:LIFO(Last In First Out,后进先出)
8086CPU提供入栈和出栈指令,最基本的两个是PUSH(入栈)和POP(出栈)。入栈和出栈操作都是以字为单位进行的
字形数据用两个单元存放,高地址单元存放高8位,低地址单元存放低8位
CPU要知道内存空间是否被当做栈来使用,需要依靠SS:SP来确定,即任意时刻,SS:SP指向栈顶空间(栈顶的段地址存放在SS中,偏移地址存放在SP中)
使用push指令时,先将SP=SP-2指向栈顶前面的单元后,在送入数据
使用pop指令时,先将栈顶的数据传出去,然后在SP=SP+2指向新栈顶
栈顶超界问题:SS和SP仅指示栈顶的地址,因此我们在编程时要自己操心栈顶超界的问题,要根据可能用到的最大栈空间,来安排栈的大小,防止入栈的数据太多或栈为空时继续出栈导致的超界
push和pop指令的格式:
push 寄存器/段寄存器/内存单元
pop 寄存器/段寄存器/内存单元
换一个角度看,任意时刻SS:SP指向栈顶元素,当栈为空时,栈中没有元素也就不存在栈顶元素,所以SS:SP只能指向栈的最底部单元下面的单元,栈最底部字单元的地址为1000:000E,所以占位空时,SP=0010H
push和pop等指令在执行的时候只修改SP,所以栈顶的变化范围为0~FFFFH,栈空时SP=0,栈满时SP=0。所以如果在此压栈,栈顶将环绕,覆盖了原来栈中的内容,所以一个栈段的容量最大为64KB
段的综述
我们可以将一段内存定义为一个段,用一个段地址指示段,用偏移地址访问段内的单元(这完全是我们自己的安排)
我们用一个段存放数据,将它定义为“数据段”
我们用一个段存放代码,将它定义为“代码段”
我们用一个段当做栈,将它定义为“栈段”
CPU按照我们的安排来访问这些段:
- 对于数据段,将它的段地址放在DS中,用mov,add,sub等访问内存单元的指令时,CPU就将我们定义的数据段中的内容当做数据来访问
- 对于代码段,将它的段地址放在CS中,将段中第一条指令的偏移地址放在IP中,这样CPU就将执行我们定义的代码段中的指令
- 对于栈段,将它的段地址放在SS中,栈顶单元的偏移地址放在SP中,这样CPU在需要进行栈操作的时候,将我们定义的栈段当做栈空间来使用
一段内存,可以既是代码的存储空间,又是数据的存储空间,还可以是栈空间,也可以什么都不是。关键在于CPU中寄存器的设置,即CS、IP、SS、SP、DS的指向