1. 使用dw伪指令定义字型数据:
a. 即define word的缩写,可以用来定义字型数据的伪指令;
b. 可以在此伪指令后面连续定义任意多个字型数据,后面的字型数据列表一般都使用十六进制表示;
c. 例如:dw 0123h, 0defch等
d. 定义的数据将会被认为是该段的一部分被加载进内存;
e. 比如在代码段中使用dw定义了一串数据,那么这串数据也将被视为代码段的一部分,它在所属段的哪里被定义,加载的时候同样也就按照顺序被加载在内存中的相应位置;
2. 示例:在代码段中定义8个字型数据,并计算这8个字型数据的值
assume cs:code
code segment
dw 0123h, 0456h, 0789h, 0abch, 0defh, 0fedh, 0cbah, 0987h
mov ax, 0
mov bx, 0
s: add ax, cs:[bx]
inc bx
loop s
mov ax, 4c00h
int 21h
code ends
end
注意:
a. 由于使用dw将数据定义在代码段的其实位置,因此当加载完程序后CS:IP指向的是这段连续的数据(程序的起始位置为CS:0处);
b. 因此直接运行改程序将会出错,因为代码段的起始位置并不是指令而是纯数据(是用来使用的并不是用来执行的),因此将会出错;
c. 因此此程序必须要在Debug中进行调试;
d. 应该先用U命令查看第几条指令是程序的真正入口,然后用R指令将IP的值设置成真正的程序入口处,然后在单步执行程序就正确了;
2. 程序和描述信息:
a. 最终形成的可执行程序实际上应该是由两个部分组成,一部分是程序,另一部分是程序的描述信息;
b. 程序就是由汇编语言翻译而来(就是和机器指令一一对应的那部分代码),描述信息是由伪指令编译而形成的,其中有描述程序的入口处地址等信息;
3. 使用end伪指令来指明程序的入口处地址:
a. 过去我们使用end时不带任何参数,其作用也仅仅用于提示编译器结束编译;
b. 除此功能之外end还有知名程序入口处地址的功能,而入口处地址就是end的唯一一个参数;
c. 一般出于安全性考虑,程序使用的空间一般由操作系统提供而不由程序员自由指定,因此该入口处地址也需要让操作系统替我们指定,因此在源程序中我们用一个标识符(即和LOOP指令中的标签式同一个概念)来指程序的入口处地址,而在编译时,编译器将会以一个具体的地址进行替换;
d. 修改后的源程序如下所示:
assume cs:code
code segment
dw 0123h, 0456h, 0789h, 0abch, 0defh, 0fedh, 0cbah, 0987h
start:
mov ax, 0
mov bx, 0
s: add ax, cs:[bx]
inc bx
loop s
mov ax, 4c00h
int 21h
code ends
end start
注意:在end伪指令后指定了一个标签start,在编译后将被替换成一个地址,同时将start指向程序的真正入口处(即第一条指令处),因此在加载程序后CS:IP将指向start所指向的位置,而不是指向定义数据的位置,这样的程序就可以直接运行而没有任何错误了;
4. 在代码段中用dw伪指令为栈开辟空间:将上例中的8个字型数据顺序倒置
assume cs:code
code segment
dw 0123h, 0456h, 0789h, 0abch, 0defh, 0fedh, 0cbah, 0987h
dw 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0
start:
mov ax, cs
mov ss, ax
mov sp, 30h
mov bx, 0
mov cx, 8
s1:
push cs:[bx]
add bx, 2
loop s1
mov bx, 0
mov cx, 8
s2:
pop cs:[bx]
mov bx, 2
loop s2
mov ax, 4c00h
int 21h
code ends
end start
注意:这种为栈开辟空间的方式非常原始;
CPU不允许也不提供两个段寄存器之间相互传送数据,因此像MOV DS, CS之类的指令都不合法将会报错,因此还是只能用普通寄存器进行中转!!!