前言
📌
汇编语言是很多相关课程(如数据结构、操作系统、微机原理)的重要基础。但仅仅从课程的角度出发就太片面了,其实学习汇编语言可以深入理解计算机底层工作原理,提升代码效率,尤其在嵌入式系统和性能优化方面有重要作用。此外,它在逆向工程和安全领域不可或缺,帮助分析软件运行机制并增强漏洞修复能力。
本专栏的汇编语言学习章节主要是依据王爽老师的《汇编语言》来写的,和书中一样为了使学习的过程容易展开,我们采用以8086CPU为中央处理器的PC机来进行学习。
文章主要内容:
1. 段寄存器
我们前面讲到,8086CPU在访问内存时要由相关部件提供内存单元的段地址和偏移地址,送入地址加法器合成物理地址。这里,需要看一下,是什么部件提供段地址。段地址在8086CPU的段存器中存放。8086CPU有4个存器:CS、DS、SS、ES。当8086CPU 要访问内存时由这4个段寄存器提供内存单元的段地址。本章中只看一下CS。
2. CS 和 IP
CS和IP是8086CPU中最关键的寄存器,它们指示了CPU当前要读取指令的地址。 CS为代码段寄存器,IP为指令指针寄存器。
在8086PC机中,任意时刻,设CS中的内容为M,IP中的内容为N,8086CPU将从内存Mx16+N单元开始,读取一条指令并执行。
也可以这样表述:8086机中,任意时刻,CPU将CS:IP指向的内容当作指令执行。
下图展示了8086CPU读取、执行指令的工作原理(图中只包括了和所要说明的问题密切相关的部件,图中数字都为十六进制)。
上图说明如下
-
8086CPU当前状态:CS中的内容为2000H,IP中的内容为0000H:
-
内存20000H~20009H单元存放着可执行的机器码;
-
内存20000H~20009H单元中存放的机器码对应的汇编指令如下:
- 地址:20000H~20002H,内容:B82301,长度:3Byte,对应汇编指令:
mov ax,0123H
- 地址:20003H~20005H,内容:BB0300,长度:3Byte,对应汇编指令:
mov bx,0003H
- 地址:20006H~20007H,内容:89D8,长度:2Byte,对应汇编指令:
mov ax,bx
- 地址:20008H~20009H,内容:01D8,长度:2Byte,对应汇编指令:
add ax,bx
- 地址:20000H~20002H,内容:B82301,长度:3Byte,对应汇编指令:
下面的一组图(图 2.11~图 2.19),以图 2.10 描述的情况为初始状态,展示了8086CPU读取、执行一条指令的过程。注意每幅图中发生的变化(下面对8086CPU的描述,是在逻辑结构、宏观过程的层面上进行的,目的是使读者对CPU工作原理有一个清晰、直观的认识,为汇编语言的学习打下基础。其中隐蔽了CPU的物理结构以及具体的工作细节)。
下面的一组图(图 2.20~图 2.26),以上面的图 2.19 的情况为初始状态,展示了 8086CPU 继续读取、执行3条指令的过程。注意IP的变化(下面的描述中,隐蔽了读取每条指令的细节)。
通过上面的过程展示,8086CPU的工作过程可以简要描述如下:
从CS:IP指向的内存单元读取指令,读取的指令进入指令缓冲器
IP=IP+所读取指令的长度,从而指向下一条指令;
执行指令。转到步骤(1),重复这个过程。
在8086CPU加电启动或复位后(即CPU刚开始工作时)CS和IP被设置为CS=FFFFH,IP=0000H,即在8086PC机刚启动时,CPU从内存FFFFOH单元中读取指令执行,FFFFOH单元中的指令是8086PC机开机后执行的第一条指令。
现在,我们更清楚了CS和IP的重要性,它们的内容提供了CPU要执行指令的地址
我们在本专栏的第1篇文章中讲过,在内存中,指令和数据没有任何区别,都是二进制信息,CPU在工作的时候把有的信息看作指令,有的信息看作数据。
现在,如果提出一个问题:CPU根据什么将内存中的信息看作指令?如何回答?
我们可以说,CPU将CS:IP指向的内存单元中的内容看作指令,因为,在任何时候,CPU将CS、IP中的内容当作指令的段地址和偏移地址,用它们合成指令的物理地址,到内存中读取指令码,执行。如果说,内存中的一段信息曾被 CPU执行过的话,那么,它所在的内存单元必然被CS:IP指向过。
结语
今天的分享到这里就结束啦!如果觉得文章还不错的话,可以三连支持一下。
也可以点点关注,避免以后找不到我哦!
Crossoads主页还有很多有趣的文章,欢迎小伙伴们前去点评,您的支持就是作者前进的动力!