汇编语言(第四版)
PS:(第一次写文章,主要用作复习,待更新)
汇编语言
基础知识
机器语言
机器语言是机器指令的集合,电子计算机的机器指令是一列二进制数字。
计算机将之转变为一列高低电平,以使计算机的电子器件受到驱动,进行运算。
每一种微处理器都有自己的机器指令集,也就是机器语言。这是因为每一种微处理器的硬件设计和内部结构都不同,就需要用不同的电平脉冲来控制,使它工作。(这也意味着每一种微处理器都有自己的汇编语言。)
汇编语言的产生
汇编语言的主体是汇编指令,汇编指令是机器指令便于记忆的书写格式。
汇编语言包括以下三类:
①汇编指令:机器码的助记符,有对应的机器码(核心)
②伪指令:没有对应的机器码,由编译器执行,计算机并不执行。
③其他符号:如+,-,*,/等,由编译器识别,没有对应的机器码
(用汇编语言编写程序的工作过程)
程序员----->汇编指令------>编译器------->机器码(1000100111011000)----->计算机(执行)
专业术语:
寄存器:简单地讲就是CPU中可以存储数据的器件,一个CPU中可以有多个寄存器。
存储器:平常我们说的内存,指令和数据在存储器中存放,也就是内存。
磁盘不同于内存,磁盘上的数据或程序如果不读到内存中,就无法被CPU使用。
指令和数据:
在内存和磁盘上,指令和数据没有任何区别,都是二进制信息。
存储单元:
存储器被划分为若干个存储单元,每个单元从0开始顺序编号。
微型机存储器的存储单元可以存储一个Byte,即8个二进制位。
微机存储器的容量是以字节为最小单位计算的。
对于大容量的存储器还可以用以下单位来表示:
1KB=1024B, 1MB=1024KB, 1GB=1024MB, 1TB=1024GB
1PB=1024GB, 1EB=1024PB, 1ZB=1024EB, 1YB=1024ZB
CPU对存储器的读写:
CPU想要进行数据的读写,必须和外部器件(标准的说法是芯片)进行下面 3类信息的交互:
① 存储单元的地址(地址信息);
② 器件的选择,读或写的命令(控制信息);
③ 读或写的数据(数据信息)。
总线:
在计算机中专门有连接CPU和其他芯片的导线,通常称为总线。
总线从物理上讲就是一根根导线的集合。
根据传送信息的不同,总线从逻辑上又分为3类:地址总线,控制总线和数据总线。
地址总线:
CPU是通过地址总线来指定存储单元的。
一个CPU有N根地址线,则可以说这个CPU的地址总线的宽度为N。
这样的CPU最多可以寻找2的N次方个内存单元。
(在电子计算机中,一根导线可以传送的稳定状态只有两种,高电平或是低电平。
用二进制表示就是1或0.)
数据总线:
CPU与内存或其他器件之间的数据总线来进行的。
数据总线的宽度决定了CPU和外界的数据传送速度。
8根数据总线一次可传送一个8位二进制数据(一字节),
16根数据总线一次可以传送两个字节。
控制总线:
CPU对外部器件的控制是通过控制总线来进行的。
控制总线是一些不同控制线的集合。
所以,控制总线的宽度决定了CPU对外部器件的控制能力。
(地址总线传输内存的地址, 数据总线进行数据的传送,控制总线决定读或写命令)
内存地址空间:
例如:一个CPU的地址总线宽度为10,那么可以寻址1024个内存单元,
这1024个可寻到的内存单元就构成这个CPU的内存地址空间。
主板:
在每一台PC(个人计算机)机中,都有一个主板,主板上有核心器件和一些主要器件,
这些器件通过总线相连(地址总线,数据总线,控制总线),
这些器件有CPU,存储器(内存),外围芯片组,扩展插槽等。
扩展插槽上一般插有RAM内存条和各类接口卡。
接口卡:
CPU对外部设备都不能直接控制,如显示器,音响,打印机等。
直接控制这些设备进行工作的是插在扩展插槽上的接口卡。
接口扩展插槽通过总线和CPU相连。
(CPU通过总线向接口卡发送命令,接口卡根据CPU的命令控制外设进行工作)
各类存储器芯片
从读写属性上分为两类:
随机存储器(RAM):可读可写,但必须带电存储,关机后存储的内容丢失;
只读存储器(ROM):只能读取不能写入,关机后其中的内容不丢失。
----------------------------------------------------------
从功能和连接上又可分为三类:
随机存储器:用于存放CPU使用的绝大部分程序和数据
装有BIOS(Basic Input/Output System,基本输入/输出系统)的ROM:
BIOS是由主板和各类接口卡厂商提供的软件系统,可以通过它利用该硬件设备进行最基本的输入输出。
接口卡上的RAM:某些接口卡需要对大批量输入,输出数据进行暂时存储,在其上装有RAM。
最典型的是显卡上的RAM,一般称为显存。
相同点:都和CPU的总线相连;
CPU对它们进行读或写的时候都通过控制线发出内存读写命令。
8086PC机内存地址空间分配的基本情况:
00000 主存储器地址空间(RAM) 9FFFF
A0000 显存地址空间 BFFFF
C0000 各类ROM地址空间 FFFFF
寄存器(内存访问)
在CPU中:
运算器进行信息处理;
寄存器进行信息存储;
控制器控制各种器件进行工作;
内部总线连接各种器件,在它们之间进行数据的传送;
不同的CPU,寄存器的个数,结构是不相同的。8086CPU有14个寄存器,每个寄存器有一个名称:AX, BX, CX, DX, SI, DI, SP, BP, IP, CS, SS, DS, ES, PSW。
通用寄存器:
8086CPU的所有寄存器都是16位的,可以存放两个字节。AX,BX,CX,DX,这4个寄存器通常用来存放一般性的数据,被称为通用寄存器。这四个寄存器都可以分为两个可独立使用的8位寄存器来用。AX:可分为AH和AL;
BX:可分为BH和BL;
CX:可分为CH和CL;
DX:可分为DH和DL;
一个16位寄存器所能存储的数据的最大值为65535。
字在寄存器中的存储:
字节:记为byte,一个字节由8个bit组成,可以存在8位寄存器中;
字:记为word,一个字由两个字节组成,这两个字节分别称为这个字的高位字节和低 位字节。
两条汇编指令:mov ,add
mov ax,18 : 将18送入寄存器AX;
add ax,18: 将寄存器AX中的数值加上8;
在进行数据传送或运算时,要注意指令的两个操作对象的位数应当是一致的。
例如: mov ax,bx;
mov ax,18H;
物理地址:
所有的内存单元构成的存储空间是一个一维的线性空间,每一个内存单元在这个空间都有唯一的地址,我们将这个唯一的地址称为物理地址。
16位结构的CPU:
16位结构描述了一个CPU具有下面几方面的结构特性:
①运算器一次最多可以处理16位的数据;
②寄存器的最大宽度为16位;
③寄存器和运算器之间的通路为16位。
8086CPU给出物理地址的方法:
8086CPU采用一种在内部用两个16位地址合成的方法来形成一个20位的物理地址。
8086CPU读写内存时:
①CPU中的相关部件提供两个16位的地址,一个称为段地址,另一个称为偏移地址;
②段地址和偏移地址通过内部总线送入一个称为地址加法器的部件;
③地址加法器将两个16位地址合成为一个20位的物理地址;
④地址加法器通过内部总线将20位物理地址送入输入输出控制电路;
⑤输入输出控制电路将20位物理地址送上地址总线;
⑥20位物理地址被地址总线传送到存储器。
地址加法器采用物理地址=段地址x16 +偏移地址的方法用段地址和偏移地址合成物理地址。
段寄存器
8086CPU有四个段寄存器:CS,DS,SS,ES
CS和IP:
CS为代码段寄存器,IP为指令指针寄存器。
8086PC机中,任意时刻,CPU将CS:IP指向的内容当作指令执行。
在8086CPU中,任意时刻,设CS中的内容为M,IP中的内容为N,8086CPU将从内存M x 16 + N单元开始,读取一条指令并执行。
修改CS,IP的指令:
8086CPU中大部分的寄存器的值都可以用mov指令来改变,mov指令被称为传送指令。
但是mov指令不能用于设置CS,IP的值,因为8086CPU没有这样的功能。
能够改变CS,IP的内容的指令被统称为转移指令:jmp指令。
Jmp 段地址+偏移地址; jmp 2AE3:3 执行后:CS=2AE3H,IP=0003H
仅修改IP:jmp 某一合法寄存器;例如:jmp ax;功能:用寄存器中的值修改IP。
内存中字的存储
CPU中,用16位寄存器来存储一个字,高8位存放高位字节,低8位存放低位字节。
字单元的概念:字单元,即存放一个字型数据(16位)的内存单元,由两个地址连续的内存单元组成。
高地址内存单元存放字型数据的高位字节,低地址内存单元中存放字型数据的低位字节。
DS和[address]
CPU要读写一个内存单元的时候,必须先给出这个内存单元的地址。
8086CPU中有一个DS寄存器,通常用来存放要访问数据的段地址。
8086CPU不支持将数据直接送入段寄存器的操作。
mov,add,sub指令
mov:
例如:mov ax,18 将18送入寄存器AX
mov 指令有以下几种形式:
mov 寄存器,数据
mov 寄存器,寄存器
mov 寄存器,内存单元
mov 内存单元,寄存器
mov 段寄存器,寄存器
mov 寄存器,段寄存器
mov 内存单元,段寄存器
add:
例如:add ax,8 将寄存器AX中的值加上8
add 指令有以下几种形式:
add 寄存器,数据
add 寄存器,寄存器
add寄存器,内存单元
add内存单元,寄存器
sub:
例如:sub bx,2 将寄存器BX中的值减去2、
sub 指令有以下几种形式:
sub 寄存器,数据
sub寄存器,寄存器
sub寄存器,内存单元
sub内存单元,寄存器
栈:
栈是一种具有特殊的访问方式的存储空间。(后进先出)
栈的两个基本操作:入栈,出栈。
入栈:将数据放到栈顶。
出栈:将数据从栈顶取出。
8086CPU的入栈出栈操作都是以字为单位的。
CPU提供的栈机制
在8086CPU中用SS段寄存器来存放栈顶的段地址,SP存放偏移地址。
任意时刻,SS:SP指向栈顶元素。
push和pop命令
push 寄存器 将一个寄存器中的数据入栈
执行过程:
①SP=SP-2,SS:SP指向当前栈顶前面的单元,以当前栈顶前面的单元为新的栈顶。
②将寄存器中的内容送入SS:SP指向的内存单元处,SS:SP此时指向新的栈顶。
pop 寄存器 出栈,用一个寄存器接收出栈的数据
执行过程:
①将SS:SP指向的内存单元处的数据送入ax中。
②SP=SP+2,SS:SP指向当前栈顶下面的单元,以当前栈顶下面的单元为新的栈顶。
当栈满的时候,使用push指令,或者当栈空的时候,使用pop指令,都将发生栈顶超界的问题。
push和pop指令,修改的只是SP,栈顶的变化范围最大为:0~FFFFH
一段内存,可以是代码的存储空间,也可以是数据的存储空间,还可以是栈空间,关键是CPU中存储器的设置,即CS,IP,SS,SP,DS的指向
第一个程序
一个源程序从写出到执行的过程:
第一步:编写汇编源程序。
第二步:对源程序进行编译连接。
可执行文件包含两部分内容。
①程序(从源程序中的汇编指令翻译过来的机器码)和数据(源程序中定义的数据)
②相关的描述信息(比如,程序有多大,要占用多少内存空间等)
第三步:执行可执行文件中的程序。
源程序
在汇编语言源程序中,包含两种指令,一种是汇编指令,一种是伪指令。
(汇编指令是有对应的机器码的指令,可以被编译为机器指令,最终为CPU所执行)
(伪指令是由编译器来执行的指令,编译器根据伪指令来进行相关的编译工作)
伪指令:
segment 和 ends:是一对成对使用的指令,segment和ends定义一个段,segment说明一个段的开始,ends说明一个段的结束。
end:是一个汇编程序的结束标记,编译器在编译汇编程序的过程中,如果碰到伪指令end,就结束对程序的编译。
assume:它假设某一段寄存器和程序中的某一个用segment…ends定义的段相关联。
标号
一个标号指代了一个地址,标号在segment的前面(如codesg),作为一个段的名称,这个段的名称最终将被编译链接程序处理为一个段的地址。
assume cs:codesg
codesg segment
mov ax, 0123H
mov bx, 0456H
add ax, bx
add ax, ax
mov ax, 4c00H ;程序返回
int 21H
codesg ends
end
[BX]和loop指令
要完整的描述一个内存单元,需要两种信息:①内存单元的地址;②内存单元的长度(类型)。
用[0]表示一个内存单元时,0表示单元的偏移地址,段地址默认在ds中,单元的长度(类型)可以由具体指令中的其它操作对象(如寄存器)指出。
[BX]
指令:mov ax, [bx]
功能:bx中存放的数据作为一个偏移地址EA,段地址SA默认在ds中。
mov [bx], ax
功能:bx中存放的数据作为一个偏移地址EA,段地址SA默认在ds中。
inc bx 的含义是bx中的内容加1.
Loop指令
格式:loop 标号
步骤:①(cx) = (cx) -1; ②判断cx中的值,不为零则转至标号处执行程序,如果为零则向下执行。
用cx和loop指令相配合实现循环功能的三个要点:
1.在cx中存放循环次数;
2.loop指令中的标号所标识地址要在前面;
3.要循环执行的程序段,要写在标号和loop指令的中间。
汇编源程序中,数据不能以字母开头,要在前面加0
段前缀
mov ax,cs:[0]
出现在访问内存单元的指令中,用于显示地指明内存单元的段地址的“ds:”,“cs:”,“ss:”,“es:”,在汇编语言中称为段前缀。
一段安全的空间
在不能确定一段内存空间中是否存放着重要的数据或代码的时候,不能随意向其中写入内容。
在一般的PC机中,DOS方式下,DOS和其他合法的程序一般都不会使用0:200 ~ 0:2ff (00200h ~ 002ffh)的256个字节的空间。
包含多个段的程序
程序取得所需内存空间的方法有两种:一是在加载程序的时候为程序分配,再就是程序在执行过程中向系统申请。
在代码段中使用数据
我们可以在程序中,定义我们希望出来的数据,这些数据就会被编译,连接程序作为程序的一部分写到可执行文件中。
assume cs:code
code segment
dw 0123h, 0456h, 0789h, 0abch, 0defh, 0fedh, 0cbdh, 0987h
start: mov bx, 0
mov ax, 0
mov cx, 8
s: add ax,cs:[bx]
add bx,2
loop s
mov ax,4c00h
int 21h
code ends
end start
程序第一行中的“dw”的含义是定义字型数据。dw即“define word”
在程序的第一条指令的前面加上了一个标号start,而这个标号在伪指令end的后面出现。end除了通知编译器程序结束外,还可以通知编译器程序的入口在什么地方。
可执行文件由描述信息和程序组成,程序来自于源程序中的汇编指令和定义的数据;描述信息则主要是编译,连接程序对源程序中相关伪指令进行处理所得到的信息。
当程序被加载入内存之后,加载者从程序的可执行文件的描述信息中读到程序的入口地址,设置CS:IP。这样CPU就从我们希望的地址处开始执行。
在代码段中使用栈
可以在程序中通过定义数据来取得一段空间,然后将这段空间当作栈空间来使用。
将数据,代码,栈放入不同的段
assume cs:code, ds:data, ss:stack
data segment
dw 0123h, 0456h, 0789h, 0abch, 0defh, 0fedh, 0cbdh, 0987h
data ends
stack segment
dw 0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0 ;16个0
stack ends
code segment
start: mov ax,stack
mov ss,ax
mov sp,20h ;设置栈顶ss:sp指向stack:20
mov ax, data
mov ds, ax ;ds指向data段
mov bx, 0 ;ds:bx指向data段中的第一个单元
mov cx, 8
s: push [bx]
add bx,2
loop s ;以上将data段中的0~15单元中的8个字型数据一次入栈
mov bx,0
mov cx,8
s0: pop [bx]
add bx,2
loop s0 ;以上依次出栈8个字型数据到data段的0~15单元中
mov ax,4c00h
int 21h
code ends
end start
在程序中,段名就相当于一个标号,它代表了段地址。
CPU到底如何处理我们定义的段中的内容,是当作指令执行,当作数据访问,还是当作栈空间,完全是靠程序中具体的汇编指令,和汇编指令对CS:IP,SS:SP,DS等寄存器的设置来决定的。
更灵活的定位内存地址的方法
and和or指令and指令:逻辑与指令,按位进行与运算。
例如:mov al,01100011B
and al,00111011B
结果:al=00100011B
通过该指令可将操作对象的相应位设置为0,其他位不变。
or指令:逻辑或指令,按位进行或运算。
例如:mov al,01100011B
or al,00111011B
结果:al=01111011B
通过该指令可以将操作对象的相应位设置为1,其他位不变。
计算机中,所有的信息都是二进制信息,而人能理解的信息是已经具有约定意义的字符。
在汇编程序中,用’…'的方式指明数据是以字符的形式给出的。
assume cs:code, ds:data
data segment
db 'unIX'
db 'foRX'
data ends
code segment
start: mov al, 'a'
mov bl, 'b'
mov ax, 4c00h
int 21h
code ends
end start
SI和DI
si和di是8086CPU中和bx功能相近的寄存器,si和di不能够分成两个8位寄存器来使用。
更多的寻址方式:
[bx(或si,di)+idata],[bx+si(或di)],[bx+si(或di) + idata]
数据处理的两个基本问题
计算机是进行数据处理,运算的机器,那么有两个基本的问题就包含在其中:
①处理的数据在什么地方?
②要处理的数据有多长?
我们定义的描述性符号:reg和sreg
reg的集合包括:ax, bx, cx, dx, ah, al, bh, bl, ch, cl, dh, dl, sp, bp, si, di;
sreg的集合包括:ds, ss, cs, es
bx, si, di, bp
在8086CPU中,只有这四个寄存器可以用在"[…]"中来进行内存单元的寻址。
在[…]中,这四个寄存器可以单个出现,或只能以四种组合出现: bx和si,bx和di,bp和si,bp和di。
*汇编语言中数据位置的表达
汇编语言中用3个概念来表达数据的位置:
(1)立即数(idata):对于直接包含在机器指令中的数据(执行前在CPU的指令缓冲器中),在汇编语言中称为:立即数,在汇编指令中直接给出。
(2)寄存器:指令要处理的数据在寄存器中,在汇编指令中给出相应的寄存器名。
(3)段地址(SA)和偏移地址(EA):指令要处理的数据在内存中,在汇编指令中可以用[X]的格式给出EA,SA在某个段寄存器中。
指令要处理的数据有多长
(1)通过寄存器名指明要处理的数据的尺寸。
(2)用操作符X ptr指明内存单元的长度,X在汇编指令中可以为word和byte
push指令只进行字操作。
div指令
格式:div reg
div 内存单元
说明:①除数:有8位和16位两种,在一个reg或内存单元中。(reg:除了ds,cs,ss,es之外的寄存器)
②被除数:默认放在AX或DX和AX中,如果除数为8位,被除数则为16位,默认在AX中存放;如果除数为16位,被除数则为32位,在DX和AX中存放,DX存放高16位,AX存放低16位。
③结果:如果除数为8位,则AL存储除法操作的商,AH存储除法操作的余数;如果除数为16位,则AX存储除法操作的商,DX存储除法操作的余数。
伪指令dd
dd是用来定义dword(double word,双字)型数据的。如:dd 1
dup
dup是一个操作符,它是和db,dw,dd等数据定义伪指令配合使用的,用来进行数据的重复。如:db 3 dup 0 定义了3个字节,它们的值都是0,相当于db 0,0,0
转移指令的原理
可以修改IP,或同时修改CS和IP的指令统称为转移指令
操作符offset
除字符offset在汇编语言中是由编译器处理的符号,它的功能是取得标号的偏移地址。
jmp指令
jmp short 标号 (转到标号处执行指令,实现的短转移)
jmp near ptr 标号 (实现的是段内近转移)
jmp far ptr 标号 (实现的是段间转移) CPU在执行jmp指令的时候并不需要转移的目的地址
jmp 16位reg ((IP)=(16位reg))
jmp word ptr 内存单元地址 (段内转移,从内存单元地址处开始存放着一个字,是转移的目的偏移地址)
jmp dword ptr 内存单元地址 (段间转移,从内存单元地址处开始存放着两个字,高地址处的字是转移的目的段地址,低地址处是转移的目的偏移地址)
jcxz指令
格式:jcxz 标号(如果(cx)=0,转移到标号处执行,短转移)
loop 指令
格式:loop 标号
步骤:①(cx) = (cx) -1; ②判断cx中的值,不为零则转至标号处执行程序,如果为零则向下执行。
inc和dec指令:
inc bx:(bx)=(bx)+ 1
dec bx:(bx)=(bx)- 1
根据位移进行转移的意义
jmp short 标号
jmp near ptr 标号
jcxz 标号
loop 标号
等几种汇编指令,它们对IP的修改是根据转移目的地址和转移起始地址之间的位移 来进行的。在它们的机器码中不包含转移的目的地址,而包含的是到目的地址的位移。这种设计,方便了程序段在内存中的浮动装配。
CALL和RET指令
ret和retf
ret指令用栈中的数据,修改IP的内容,从而实现近转移。
步骤:①(IP)=((SS)*16+(sp)) ②(sp)=(sp)+2
retf指令用栈中的数据,修改CS和IP的内容,从而实现远转移。
步骤: ①(IP)=((SS)*16+(SP)) ②(SP)=(SP)+2 ③(CS)=((SS)*16+(SP)) ④(SP)=(SP)+2
call指令
步骤:①将当前的IP或CS和IP入栈; ②转移
格式:call 标号(将当前IP压栈后,转到标号处执行指令,近转移)
相当于:①push IP ②jmp near ptr 标号
call far ptr 标号(实现的是段间转移)
相当于:①push CS ②push IP ③jmp far ptr 标号
call 16位reg
相当于:①push IP ②jmp 16位reg
call word ptr 内存单元地址
相当于:①push IP ②jmp word ptr 内存单元地址
call dword ptr 内存单元地址
相当于:①push CS ②push IP ③jmp dword ptr 内存单元地址
mul指令
格式:mul reg
mul 内存单元
说明:①两个相乘的数:两个相乘的数,要么都是8位,要么都是16位。如果是8位,一个默认放在AL中,另一个放在8位reg或内存字节单元中;如果是16位,一个默认 在AX中,另一个放在16位reg或内存字单元中。
②结果:如果是8位乘法,结果默认放在AX中;如果是16位乘法,结果高位默认在DX中存放,低位在AX中存放。
标志寄存器
CPU内部的寄存器中,有一种特殊的寄存器(对于不同的处理机,个数和结构都可能不同)具有以下3中作用:
(1)用来存储相关指令的某些执行结果;
(2)用来为CPU执行相关指令提供行为依据;
(3)用来控制CPU的相关工作方式。
这种特殊的寄存器在8086CPU中被称为标志寄存器。
flag寄存器是按位起作用的:
15 | 14 | 13 | 12 | 11 | 10 | 9 | 8 | 7 | 6 | 5 | 4 | 3 | 2 | 1 | 0 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
OF | DF | IF | TF | SF | ZF | AF | PF | CF |
ZF标志
flag的第6位是ZF,零标志位。它记录相关指令执行后,其结果是否为0。如果结果为0,那么ZF=1;如果不为0,ZF=0。
PF标志
flag的第2位是PF,奇偶标志位。它记录相关指令执行后,其结果的所有bit位中1的个数是否为偶数。如果1的个数为偶数,那么PF=1,如果为奇数,那么PF=0.
SF标志
flag的第7位是SF,符号标志位。它记录相关指令执行后,其结果是否为负。如果结果为负,那么SF=1,如果非负,SF=0。
CF标志
flag的第0位是CF,进位标志位。一般情况下,在进行无符号数运算的时候,它记录了运算结果的最高有效位向更高位的进位值,或从更高位的借位值。
OF标志
flag的第11位是OF,溢出标志位。一般情况下,OF记录了有符号数运算的结果是否发生了溢出。如果发生溢出,OF=1,如果没有,OF=0。 OF与CF的区别:CF是对无符号数运算有意义的标志位,而OF是对有符号数运算有意义的标志位。
adc指令
带进位加法指令
格式:adc操作对象1,操作对象2(操作对象1=操作对象1+操作对象2+CF)
sbb指令
带借位减法指令
格式:sbb操作对象1,操作对象2(操作对象1=操作对象1-操作对象2-CF)
cmp指令
cmp是比较指令,相当于减法指令,只是不保存结果。
格式:cmp操作对象1,操作对象2 (计算 操作对象1-操作对象2 但不保存结果,仅仅根据计算结果对标志寄存器进行设置)
比较指令的设计思路,即:通过做减法运算,影响标志寄存器,标志寄存器的相关位记录了比较结果。
CPU在执行cmp指令的时候,也包含了两种含义:进行无符号数运算和进行有符号数运算。
cmp指令执行后,sf和of的值:
(1)如果sf=1,而of=0
说明没有溢出,逻辑上真正结果的正负=实际结果的正负
(2)如果sf=1,而of=1:
说明有溢出,逻辑上真正结果的正负!=实际结果的正负 如果因为溢出导致实际结果为负,那么逻辑上真正的结果必然为正。
(3)如果sf=0,而of=1
说明有溢出,逻辑上真正结果的正负!=实际结果的正负 如果因为溢出导致实际结果为正,那么逻辑上真正的结果必然为负。
(4)如果sf=0,而of=0
说明没有溢出,逻辑上真正结果的正负=实际结果的正负
根据无符号数的比较结果(检测zf,cf的值)进行转移的条件指令:
指令 含义 检测的相关标志位
je 等于则转移 zf=1
jne 不等于则转移 zf=0
jb 低于则转移 cf=1
jnb 不低于则转移 cf=0
ja 高于则转移 cf=0且zf=0
jna 不高于则转移 cf=1或zf=1
DF标志和串传送指令
flag的第10位是DF,方向标志位。在串处理指令中,控制每次操作后si,di的增减。
df = 0 每次操作后si,di递增;
df = 1 每次操作后si,di递减;
串传送指令
movsb,movsw和rep movsw指令:
格式:movsb
步骤:①((es)*16+(di))=((ds)*16+(si))
②如果df=0则: (si)=(si)+1 (di)=(di)+1
如果df=1则: (si)=(si)-1 (di)=(di)-1
格式:movsw (传送一个字)
rep movsw (根据cx的值,重复执行后面的传送语句)
cld和std指令:
cld指令:将标志寄存器的df位置0
std指令:将标志寄存器的df位置1
pushf和popf
pushf将标志寄存器的值压栈,popf从栈中弹出数据,送入标志寄存器中。
内中断
任何一个通用的CPU,比如8086,都具备一种能力,可以在执行完当前正在执行的指令后,检测从CPU外部发送过来的或内部的产生的一种特殊的信息,并且可以立即对所接收到的信息进行处理。这种特殊的信息,我们可以称之为:中断信息。
"中断信息"是要求CPU马上进行某种处理,并向所要进行的该种处理提供了必备的参数的通知信息。
内中断的产生
(1)除法错误;
(2)单步执行;
(3)执行into指令;
(4)执行int指令。
中断类型码
中断类型码为一个字节型数据,可以表示256种中断信息的来源
中断处理程序
用来处理中断信息的程序被称为中断处理程序。
根据CPU的设计,中断类型码的作用就是用来定位中断处理程序。
中断向量表
CPU用8位的中断类型码通过中断向量表找到相应的中断处理程序的入口地址。中断向量表就是中断向量的列表。所谓中断向量,就是中断处理程序的入口地址。(对于8086PC机,中断向量表指定放在内存地址0处,从内存0000:0000到0000:03FF的1024个单元中)
一个表项占两个字,高地址字存放段地址,低地址字存放偏移地址。
中断过程
用中断类型码找到中断向量,并用它设置CS和IP,这个工作是由CPU的硬件自动完成的。CPU硬件完成这个工作的过程被称为中断过程。(程序员无法改变这个过程中的工作)
中断处理程序和iret指令
步骤:
(1)保存用到的寄存器
(2)处理中断
(3)恢复用到的寄存器
(4)用iret指令返回
iret指令:
步骤:①pop IP ②pop CS ③popf
"-"是编译器识别的运算符号,编译器可以用它来进行两个常数的减法。编译器可以处理表达式。
单步中断
CPU在执行完一条指令后,如果检测到标志寄存器的TF位为1,则产生单步中断,引发中断过程。单步中断类型码为1
CPU提供单步中断功能的原因就是,为单步跟踪程序的执行过程,提供了实现机制。
CPU在执行完设置SS的指令后,不响应中断。
int 指令
int指令:
格式:int n(n为中断类型码,它的功能是引发中断过程)
步骤:①取中断类型码n;
②标志寄存器入栈,IF=0,TF=0;
③CS,IP入栈;
④(IP)=(n4), (CS)=(n4+2).
int指令的最终功能和call指令相似,都是调用一段程序。
BIOS和DOS所提供的中断例程
在系统板的ROM中存放在一套程序,称为BIOS(基本输入输出系统)包含以下内容:
(1)硬件系统的检测和初始化程序;
(2)外部中断和内部中断的中断例程;
(3)用于对硬件设备进行I/O操作的中断例程;
(4)其他和硬件系统相关的中断例程。
和硬件设备相关的DOS中断例程中,一般都调用了BIOS的中断例程。
BIOS和DOS中断例程的安装过程
(1)开机后,CPU一加电,初始化(CS)=0FFFFH,(IP)=0,自动从FFFF:0单元开始执行程序。FFFF:0处有一条转跳指令,CPU执行该指令后,转去执行BIOS中的硬件系统检测和初始化程序。
(2)初始化程序将建立BIOS所支持的中断向量,即将BIOS提供的中断例程的入口地址登记在中断向量表中。
(3)硬件系统检测和初始化完成后,调用int 19h进行操作系统的引导。从此将计算机交由操作系统控制。
(4)DOS启动后,除完成其他工作外,还将它所提供的中断例程装入内存,并建立相应的中断向量。
BIOS中断例程应用
int 10h是BIOS提供的中断例程。
一般来说,一个供程序员调用的中断例程中往往包含多个子程序,中断例程内部用传递进来的参数来决定执行哪一个子程序。BIOS和DOS提供的中断例程,都用ah来传递内部子程序的编号。
端口和外中断
在PC机系统中,和CPU通过总线相连的芯片除各种寄存器外,还有以下3种芯片:
(1)各种接口卡(比如显卡,网卡)上的接口芯片,它们控制接口卡进行工作;
(2)主板上的接口芯片,CPU通过它们对部分外设进行访问;
(3)其它芯片,用来存储相关的系统信息,或进行相关的输入输出处理。
在这些芯片中,都有一组可以由CPU读写的寄存器,它们有以下相同点:
(1)都和CPU总线相连,当然这种连接是通过它们所在的芯片进行的;
(2)CPU对它们进行读或写的时候都通过控制线向它们所在的芯片发出端口读写命令。
从CPU的角度,将这些寄存器都当作端口,对它们进行统一编址,从而建立了一个统一的端口地址空间。每一个端口在地址空间都有一个地址。
CPU可以直接读写以下3个地方的数据:
(1)CPU内部的寄存器;
(2)内存单元;
(3)端口。
在PC系统中,CPU最多可以定位64KB个不同的端口,。则端口地址的范围为0~65535
对端口的读写不能用mov,push,pop等内存读写指令。
in和out指令:
in指令:从端口读取数据
格式:in al, 60h (从60h端口读取一个字节)
out指令:往端口写数据
格式:out 60h, al (往端口60h写入一个字节)
在in和out指令中,只能使用ax或al来存放从端口中读入的数据或要发送到端口中的 数据。访问8位端口时用al,访问16位端口时用ax。
CMOS RAM 芯片
pc机中,有一个CMOS RAM 芯片,一般简称为CMOS,此芯片的特征如下:
(1)包含一个实时钟和一个有128个存储单元的RAM存储器。
(2)该芯片靠电池供电,关机后其内部的实时钟仍然可以正常工作,RAM中的信息不丢失。
(3)128个字节的RAM中,内部实时钟占用0~0dh单元来保存时间信息,其余大部分单元用于保存系统配置信息,供系统启动时BIOS程序读取。
(4)该芯片内部有两个端口,分别为70h和71h。CPU通过这两个端口来读写CMOS。
(5)70h为地址端口,存放要访问的CMOS RAM单元的地址;71h为数据端口,存放从选定的CMOS RAM单元中读取的数据,或要写入到其中的数据。
shl和shr指令
shr是逻辑左移指令。
功能:①将一个寄存器或内存单元中的数据向左移位;
②将最后移出的一位写入CF中;
③最低位用0补充。(如果移动位数大于1时,必须将移动位数放在cl中)
shr是逻辑右移指令:
功能:①将一个寄存器或内存单元中的数据向右移位;
②将最后移出的一位写入CF中;
③最高位用0补充。 (如果移动位数大于1时,必须将移动位数放在cl中)
外中断
外设的输入不直接送入内存和CPU,而是送入相关的接口芯片的端口中;CPU向外设的输出也不是直接送入外设,而是先送入端口中,再由相关的芯片送到外设。
外中断信息
在PC机中,外中断源一共有以下两类:
1.可屏蔽中断:
可屏蔽中断是CPU可以不响应的外中断。CPU是否响应可屏蔽中断,要看标志寄存器的IF位的设置。当CPU检测到可屏蔽中断信息时,如果IF=1,则CPU在执行完当前指令后响应中断,引发中断例程;如果IF=0,则不响应可屏蔽中断。
sti和clt指令:
sti:设置IF=1
cli:设置IF=0
2.不可屏蔽中断:
不可屏蔽中断是指CPU必须响应的外中断。当CPU检测到不可屏蔽中断信息时,则在执行完当前指令后,立即响应,引发中断例程。
对于8086CPU,不可屏蔽中断的中断类型码固定为2.
键盘输入
寄存器的端口地址为60h
一般将按下一个键时产生的扫描码称为通码,松开一个键产生的扫描码称为断码。
断码=通码+80h
引发9号中断
在BIOS键盘缓冲区中,一个键盘输入用一个字单元存放,高位字节存放扫描码,低位字节存放字符码(ASCII码)。
键盘输入的处理过程:
①键盘产生扫描码;
②扫描码送入60h端口
③引发9号中断;
④CPU执行int 9中断例程处理键盘输入。
直接定址表
描述了单元长度的标号
assume cs:code
code segment
a db 1,2,3,4,5,6,7,8
b dw,0
start: mov si,0
mov cx,8
s: mov al,a[si]
mov ah,0
add b,ax
inc si
loop s
mov ax,4c00h
int 21h
code ends
end start
在code段中使用的标号a,b后面没有": ",它们是同时描述内存地址和单元长度的标号。
我们称这种标号为数据标号,它标记了存储数据的单元的地址和长度。
在其它段中,我们也可以使用数据标号来描述存储数据的单元的地址和长度。
注意,在后面加有":"的地址标号,只能在代码段中使用,不能在其它段中使用。
直接定址表
利用表,在两个数据集合之间建立一种映射关系,使我们可以用查表的方法根据给出的数据得到其在另一集合中的对应数据。这样做的目的一般来说有以下3个:
(1)为了算法的清晰和简洁;
(2)为了加快运算速度;
(3)为了使程序易于扩充。
这种可以通过依据数据,直接计算出所要找的元素的位置的表,我们称其为直接定址表。
使用BIOS进行键盘输入和磁盘读写
使用int 16h中断例程读取键盘缓冲区
BIOS的int 9 中断例程和int 16h中断例程是一对相互配合的程序。int 9 中断例程向键盘缓冲区写入,int 16h中断例程从缓冲区读出。
应用int 13h中断例程对磁盘进行读写
磁盘的实际访问由磁盘控制器进行,我们可以通过控制磁盘控制器来访问磁盘。只能以扇区为单位对磁盘进行读写。在读写扇区的时候要给出面号,磁道号和扇区号。面号和磁道号从0开始,扇区号从1开始。
BIOS提供的访问磁盘的中断例程为int 13h
逻辑扇区号=(面号x80+磁道号)x18+扇区号-1