我们使用reg来表示一个寄存器,用sreg来表示一个段寄存器
reg的集合包括:ax、bx、cx、dx、ah、al、bh、bl、ch、cl、dh、dl、sp、bp、si、di
sreg的集合包括:ds、ss、cs、es
一、bx、si、di和bp(base pointer)
在8086CPU中,只有这四个寄存器可以用在[ ]中来进行内存单元的寻址
比如,下面的指令都是正确的:
mov ax,[bx]
mov ax,[bx+si]
mov ax,[bx+di]
mov ax,[bp]
mov ax.[bp+si]
mov ax,[bp+di]
而下面的指令是错误的:
mov ax,[cx]
mov ax,[ax]
mov ax,[dx]
mov ax,[ds]
在[…]中,这4个寄存器可以单个出现,或只能以4种组合出现:bx和si、bx和di、bp和si、bp和di
比如下面的指令是正确的:
mov ax,[bx]
mov ax,[si]
mov ax,[di]
mov ax,[bp]
mov ax,[bx+si]
mov ax,[bx+di]
mov ax,[bp+si]
mov ax,[bp+di]
mov ax,[bx+si+idata]
mov ax,[bx+di+idata]
mov ax,[bp+si+idata]
mov ax,[bp+di+idata]
下面的指令是错误的:
mov ax,[bx+bp]
mov ax,[si+di]
只要在[…]中使用寄存器bp,而指令中没有显性给出段地址,段地址就默认在ss中
这点要注意,利用[...]
进行内存单元的访问时,如果使用bp,则默认的段地址是ss,如果使用bx,则默认的段地址是ds,要区分开。
二、机器指令处理的数据在什么地方
绝大部分机器指令都是进行数据处理的指令,处理大致可以分为3类:读取、写入、运算。在机器指令这一层来讲,并不关心数据的值是多少,而关心指令执行前那一刻,它将要处理的数据所在的位置。
指令在执行前,所要处理的数据可以在3个地方:CPU内部、内存、端口,比如下图所列的指令:
机器码 | 汇编指令 | 指令执行前数据的位置 |
---|---|---|
8E1E0000 | mov bx,[0] | 内存,ds:0单元 |
89C3 | mov bx,ax | CPU内部,ax寄存器 |
BB0100 | mov bx,1 | CPU内部,指令缓冲器 |
三、汇编语言中数据位置的表达
汇编语言中用3个概念来表达数据的位置。
3.1 立即数(idata)
对于直接包含在机器指令中的数据(执行前在CPU的指令缓冲器中),在汇编语言中被称为立即数(idata),在汇编指令中直接给出。
例如:
mov ax,1
add bx,2000h
or bx,00010000b
mov al,'a'
3.2 寄存器
如果指令要处理的数据在寄存器中,则在汇编指令中要给出相应的寄存器名
mov ax,bx
mov ds,ax
push bx
mov ds:[0],bx
push ds
mov ss,ax
mov sp,ax
3.3 段地址(SA)和段偏移地址(EA)
如果指令要处理的数据在内存中,则在汇编指令中可用[X]的格式给出。
存放段地址的寄存器可以是默认的,比如下图的指令,段地址默认在ds中:
mov ax,[0]
mov ax,[di]
mov ax,[bx+8]
mov ax,[bx+si]
mov ax,[bx+si+8]
下图的指令,段地址默认在ss中:
mov ax,[bp]
mov ax,[bp+8]
mov ax,[bp+si]
mov ax,[bp+si+8]
存放段地址的寄存器也可以是显性给出的,比如以下的指令:
mov ax,ds:[bp] 含义:(ax)=((ds)*16+(bp))
mov ax,es:[bx] 含义:(ax)=((es)*16+(bx))
mov ax,ss:[bx+si] 含义:(ax)=((ss)*16+(bx)+(si))
mov ax,cs:[bx+si+8] 含义:(ax)=((cs)*16+(bx)+(si)+8)
四、寻址方式
当数据存放在内存中的时候,我们可以用多种方式来给定这个内存单元的偏移地址,这种定位内存单元的方法一般称为寻址方式。
8086CPU有多种寻址方式,下表列出了这些寻址方式:
五、确定指令要处理的数据长度
8086CPU指令可以处理两种大小的数据,byte和word。所以在机器指令中,我们要指明指令进行的是字操作还是字节操作。在汇编语言中,可以有如下几种方式指明操作的数据长度:
5.1 通过寄存器名指明要处理的数据长度
下面的指令中,寄存器指明了指令进行的是字操作。
mov ax,1
mov bx,ds:[0]
mov ds,ax
mov ds:[0],ax
inc ax
add ax,1000
下面的指令中,寄存器指明了指令进行的是字节的操作。
mov al,1
mov al,bl
mov al,ds:[0]
mov ds:[0],al
inc al
add al,100
5.2 在没有寄存器名存在的情况下,用操作符X ptr指明内存单元的长度,X在汇编指令中可以为word或byte
例如,下面的指令中,用word ptr指明了指令访问的内存单元是一个字单元
mov word ptr ds:[0],1
inc word ptr [bx]
inc word ptr ds:[0]
add word ptr [bx],2
下面的指令中,用byte ptr指明了指令访问的内存单元是一个字节单元
mov byte ptr ds:[0],1
inc byte ptr [bx]
inc byte ptr ds:[0]
add byte ptr [bx],2
在没有寄存器参与的内存单元访问指令中,用word ptr或byte ptr显性地指明所要访问的内存单元的长度是很有必要的。否则,CPU无法得知所要访问的单元是字单元,还是字节单元。假设我们用Debug查看内存的结果如下:
2000: 1000 FF FF FF FF FF FF ......
那么指令:
mov ax,2000H
mov ds,ax
mov byte ptr [1000H],1
将使内存中的内容变为:
2000: 1000 01 FF FF FF FF FF
而指令:
mov ax,2000H
mov ds,ax
mov word ptr [1000H],1
将使内存中的内容变为:
2000:1000 01 00 FF FF FF FF ....
5.3 其他方法
有些指令默认了访问的是字单元还是字节单元,比如,push[1000H]就不用指明访问的是字单元还是字节单元,因为push指令只进行字操作。
六、寻址方式的综合应用
通过一个问题来进一步讨论下各种寻址方式的作用。
关于DEC公司的一条记录(1982年)如下:
这些数据在内存中以如下的方式存放:
可以看到,这些数据存储的起始地址为seg:60
,从起始地址开始,以ASCⅡ的形式存储了三个字节的公司名称,然后从seg:60+3
开始以ASCⅡ的形式存储了九个字节的总裁姓名,其他数据也都按各自的内存地址进行存放。
以上是该公司1982年的情况,到了1988年DEC公司的信息有了如下变化。
- Ken Olsen的排名变为了38
- DEC的收入增加了70亿美元
- 该公司的著名产品已变为VAX系列计算机
我们的任务是编程修改内存中的过时数据,整个过程如下:
- 首先确定DEC公司记录的位置:
R=seg:60
- 排名字段在记录中的位置:
0Ch
- 修改
R+0ch
处的数据 - 后续的修改过程同上,确定记录位置,接着修改对应位置的数据
根据上面的分析,程序如下:
mov ax,seg
mov ds,ax
mov bx,60h ;确定记录地址,ds:bx
mov word ptr [bx+0ch],38 ;排名字段改为38
add word ptr [bx+0eh],70 ;收入字段增加70
mov si,0 ;用si来定位产品字符串中的字符
mov byte ptr [bx+10h+si],'V'
inc si
mov byte ptr [bx+10h+si],'A'
inc si
mov byte ptr [bx+10h+si],'X'
从上面可以看出,8086CPU提供的如[bx+si+idata]的寻址方式为结构化数据的处理提供了方便。一般来说,我们可以用[bx+idata+si]的方式来访问结构体中的数据。用bx定位整个结构体,用idata定位结构体中的某一个数据项,用si定位数组项中的每个元素。为此,汇编语言提供了更为贴切的书写方式,如:[bx].idata
、[bx].idata[si]
七、div指令
div是除法指令,使用div做除法的时候应该注意以下问题。
- 除数:有8位和16位两种,在一个reg或内存单元中
- 被除数:默认放在AX或DX和AX中,如果除数为8位,被除数则为16位,默认在AX中存放;如果除数为16位,被除数则为32位,在DX和AX中存放,DX存放高16位,AX存放低16位。
- 结果:如果除数为8位,则AL存储除法操作的商,AH存储除法操作的余数;如果除数为16位,则AX存储除法操作的商,DX存储除法操作的余数。
格式如下:
div reg
div 内存单元
使用举例:
div byte ptr ds:[0]
含义:(al)=(ax)/((ds)*16+0)的商
(ah)=(ax)/((ds)*16+0)的余数
div word ptr es:[0]
含义:(ax)=[(dx)*10000H+(ax)]/((es)*16+0)的商
(dx)=[(dx)*10000H+(ax)]/((es)*16+0)的余数
八、伪指令dd
我们可以用db和dw定义字节型数据和字型数据。dd是用来定义dword(double word,双字)型数据的。比如:
data segment
db 1
dw 1
dd 1
data ends
在data段中定义了3个数据:
- 第一个数据为01H,在data:0处,占1个字节
- 第二个数据为0001H,在data:1处,占1个字
- 第三个数据为00000001H,在data:3处,占2个字
九、dup
dup是一个操作符,在汇编语言中同db、dw、dd等一样,也是由编译器识别处理的符号。它是和db、dw、dd等数据定义伪指令配合使用的,用来进行数据的重复,比如:
db 3 dup (0)
定义了3个字节,它们的值都是0,相当于db 0,0,0
db 3 dup (0,1,2)
定义了9个字节,它们是0、1、2、0、1、2、0、1、2,相当于db 0,1,2,0,1,2,0,1,2
dup是一个十分有用的操作符,比如要定义一个容量为200个字节的栈段,如果不用dup,则必须:
stack segment
dw 0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0
dw 0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0
dw 0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0
dw 0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0
stack ends
所以这种情况下,我们使用dup可以轻松解决:
stack segment
db 200 dup (0)
stack ends