1.3 汇编语言的组成
汇编语言发展至今,有以下三类指令组成:
1.3.1 汇编指令
汇编指令是机器码的助记符,每个汇编指令都有对应的机器码。它们是汇编语言的核心,决定了汇编语言的特性。例如,汇编指令 mov ax, bx
对应的机器码是 1000100110110000
。
1.3.2 伪指令
伪指令没有对应的机器码,它们由编译器执行,而计算机并不执行。这些指令用于帮助编译器更好地理解和组织程序代码,例如数据定义、段定义等。
1.3.3 其他符号
其他符号包括如 +
、-
、*
、/
等运算符,由编译器识别,没有对应的机器码。这些符号用于在汇编代码中进行各种操作,如算术运算和逻辑运算。
汇编语言的核心
汇编语言的核心是汇编指令,它决定了汇编语言的特性。通过汇编指令,程序员能够直接控制计算机的硬件,使其按照预定的逻辑执行任务。
1.4 存储器
CPU 是计算机的核心部件,它控制整个计算机的运作并进行运算。要让 CPU 工作,就必须向它提供指令和数据。这些指令和数据存放在存储器中,也就是我们平时所说的内存。在一台 PC 机中,内存的作用仅次于 CPU。即使有再好的 CPU,没有内存也无法工作。磁盘不同于内存,磁盘上的数据或程序如果不读到内存中,就无法被 CPU 使用。要灵活地利用汇编语言编程,我们首先要了解 CPU 是如何从内存中读取信息,以及向内存中写入信息的。
1.5 指令和数据
指令和数据是应用上的概念。在内存或磁盘上,指令和数据没有任何区别,都是二进制信息。CPU 在工作的时候把某些信息看作指令,其他的信息看作数据,为同样的信息赋予了不同的意义。
例如,内存中的二进制信息 1000100110110000
,计算机可以把它看作大小为 89D8H
的数据来处理,也可以将其看作指令 mov ax, bx
来执行。
- 数据:
1000100110110000 -> 89D8H
- 指令:
1000100110110000 -> mov ax, bx
1.6 存储单元
存储器被划分成若干个存储单元,每个存储单元从 0 开始顺序编号。例如,一个存储器有 128 个存储单元,编号从 0 到 127,如图 1.2 所示。
一个存储单元能存储多少信息呢?我们知道,电子计算机的最小信息单位是 bit(音译为比特),也就是一个二进制位。8 个 bit 组成一个 Byte,也就是通常讲的一个字节。微型机存储器的存储单元可以存储一个 Byte,即 8 个二进制位。一个存储器有 128 个存储单元,它可以存储 128 个 Byte。
微机存储器的容量是以字节为最小单位来计算的。对于拥有 128 个存储单元的存储器,我们可以说,它的容量是 128 个字节。
0
1
2
3
...
124
125
126
127
对于大容量的存储器一般还用以下单位来计量容量(以下用 B 来代表 Byte):
- 1 KB = 1024 B
- 1 MB = 1024 KB
- 1 GB = 1024 MB
- 1 TB = 1024 GB
磁盘的容量单位同内存的一样,实际上以上单位是微机中常用的计量单位。
1.7 CPU 对存储器的读写
存储器被划分成多个存储单元,存储单元从零开始顺序编号。这些编号可以看作存储单元在存储器中的地址,就像一条街上的每个房子都有门牌号码。CPU 要从内存中读数据,首先要指定存储单元的地址。也就是说,它要先确定要读取哪个存储单元中的数据,就像在一条街上找人,先要确定他住在哪个房子里。
在一台微机中,不只有存储器这一种器件。CPU 在读写数据时还要指明要对哪个器件进行操作,是从中读出数据,还是向里面写入数据。
CPU 要进行数据的读写,必须和外部器件进行三类信息的交互:
- 存储单元的地址(地址信息)
- 器件的选择,读或写的命令(控制信息)
- 读或写的数据(数据信息)
CPU 是通过地址总线、控制总线和数据总线将地址、数据和控制信息传到存储器芯片中的。
1.7.1 CPU 从内存中读取数据的过程
以下是 CPU 从内存中读取数据的过程(见图 1.3):
- CPU 通过地址线将地址信息 3 发出。
- CPU 通过控制线发出内存读命令,选中存储器芯片,并通知它,将要从中读取数据。
- 存储器将 3 号单元中的数据通过数据线送入 CPU。
写操作与读操作的步骤相似。如向 3 号单元写入数据 26:
- CPU 通过地址线将地址信息 3 发出。
- CPU 通过控制线发出内存写命令,选中存储器芯片,并通知它,要向其中写入数据。
- CPU 通过数据线将数据 26 送入内存的 3 号单元中。
1.7.2 使用机器码和汇编指令
我们知道 CPU 是如何进行数据读写的。那么,如何命令计算机进行数据的读写呢?要让计算机或微处理器工作,应向它输入能够驱动它进行工作的电平信息(机器码)。
例如,对于 8086 CPU,下面的机器码可以完成从 3 号单元读数据的操作:
- 机器码:
101000010000001100000000
- 含义:从 3 号单元读取数据送入寄存器 AX
CPU 接收这条机器码后,将完成上述的读写工作。机器码难于记忆,用汇编指令来表示,情况如下:
- 机器码:
101000010000001100000000
- 对应的汇编指令:
mov ax, [3]
- 含义:传送 3 号单元的内容入 AX
1.8 地址总线
CPU 是通过地址总线来指定存储器单元的。地址总线上能传送多少个不同的信息,CPU 就可以对多少个存储单元进行寻址。
假设一个 CPU 有 10 根地址总线。我们知道,在电子计算机中,一根导线可以传送的稳定状态只有两种,高电平或低电平,用二进制表示就是 1 或 0。10 根导线可以传送 10 位二进制数据,而 10 位二进制数可以表示 1024(2 的 10 次方)个不同的数据,最小数为 0,最大数为 1023。
图 1.4 展示了一个具有 10 根地址线的 CPU 向内存发出地址信息 11 时 10 根地址线上传送的二进制信息。类似地,访问地址为 12、13、14 等的内存单元时,地址总线上传送的内容也可以类推。
一个 CPU 有 N 根地址线,则可以说这个 CPU 的地址总线的宽度为 N。这样的 CPU 最多可以寻址 2 的 N 次方个内存单元。
CPU
1
1
0
地址总线
1
0
0
内存
7
0
0
数据总线
控制总线
图 1.4 地址总线上发送的地址信息
1.9 数据总线
CPU 与内存或其他器件之间的数据传送是通过数据总线来进行的。数据总线的宽度决定了 CPU 和外界的数据传送速度。8 根数据总线一次可传送一个 8 位二进制数据(即一个字节)。16 根数据总线一次可传送两个字节。
8088 CPU 的数据总线宽度为 8,8086 CPU 的数据总线宽度为 16。图 1.5 展示了 8088 CPU 数据总线上的数据传送情况;图 1.6 展示了 8086 CPU 数据总线上的数据传送情况。
CPU
1
0
0
数据总线
第一次,D8
第二次,89
内存
控制线
图 1.5 8 位数据总线上传送的信息
CPU
数据总线
一次传送 89D8
内存
控制线
图 1.6 16 位数据总线上传送的信息
1.10 控制总线
CPU 对外部器件的控制是通过控制总线来进行的。控制总线是一些不同控制线的集合,有多少根控制总线,就意味着 CPU 提供了对外部器件的多少种控制。因此,控制总线的宽度决定了 CPU 对外部器件的控制能力。
例如,内存读或写命令是由几根控制线综合发出的,其中有一根称为“读信号输出”的控制线负责由 CPU 向外传送读信号,CPU 向该控制线上输出低电平表示将要读取数据;有一根称为“写信号输出”的控制线则负责传送写信号。
1.10.1 小结
- 汇编指令是机器指令的助记符,同机器指令一一对应。
- 每一种 CPU 都有自己的汇编指令集。
- CPU 可以直接使用的信息在存储器中存放。
- 在存储器中,指令和数据没有任何区别,都是二进制信息。
- 存储单元从零开始顺序编号。
- 一个存储单元可以存储 8 个 bit,即 8 位二进制位(1 Byte)。
- 内存容量单位:1 KB = 1024 B,1 MB = 1024 KB,1 GB = 1024 MB。
- 每个 CPU 芯片都有许多管脚,这些管脚与总线相连,可以说,这些管脚引出总线。一个 CPU 可以引出 3 种总线的宽度标志了这个 CPU 的不同性能:
- 地址总线的宽度决定了 CPU 的寻址能力。
- 数据总线的宽度决定了 CPU 与其他器件进行数据传送时的一次数据传送量。
- 控制总线的宽度决定了 CPU 对系统中其他器件的控制能力。
在汇编课程中,我们从功能的角度介绍了 3 类总线,对实际的连接情况不做讨论。