分析程序,在运行前思考:这个程序是否能够正确返回?
是,分析如下
start: mov ax,0
s: nop ; nop标号语句,在运行时在代码段中分配一个字节的空间,
nop ; 这个字节(空间)的值为90h。
; 操作符 `offset` 的功能是取得标号的偏移地址。
mov di,offset s ; 将 s 的偏移地址存到 di 寄存器中
mov si,offset s2 ; 将 s2 的偏移地址存到 si 寄存器中
mov ax,cs:[si] ; 此行是将cs:[si]内存中的机器码存到ax寄存器中,
; 这个机器码是由编译器将 s2 标号字段中的指令编译而成。
mov cs:[di],ax ; 将 ax 中的 s2 标号字段的机器码存放到 s 标号字段中。
s0: jmp short s ; 跳转到 s 标号字段处执行代码。
s: jmp short s1 ; 根据我们之前的分析, 指令是用相对偏移来表示的
; 因此执行的操作并不是真的跳转到 s1 这个标号,
; 而是跳转编译时确定的 该指令到 s1 标号的偏移量。
; 所以我们要分析接下来程序的流程的话 , 就必须先编译程序 ,
; 通过查看这条指令的机器代码,才知道偏移量是多少。
; 然后再根据这个偏移量确定程序下一步应该执行哪里的指令。
; 根据下图的编译结果 , 可以发现 ,
; jmp short s1 在编译后得到的指令是 : EB F6
; 由上可知,偏移量是 :F6
; 偏移量是由 补码 来表示的,由书中 附注二 ,
; 我们可以算出 F6对应的有符号十进制数为 -10。
; 从这里,我们可以知道,这条指令是将 ip 的值加上 -10。
; 那么,我们再看看 ip - 10 指向的地址是哪里呢 ?
; 由下图的编译结果,我们可以知道,
; 它指向的刚好就是 code segment 开始的位置.
mov ax,4c00h
int 21h ;看到这两句,大家就知道,程序是可以正常返回了
运行之后再思考:为什么是这种结果?
编译
注意这里使用 debug 的 u 命令进行反汇编的时候要指定代码段的偏移地址为 0 ,否则 debug 会自动从 start 标号的地方开始反汇编
不完整的反编译代码
有时候单纯从 u 0 命令无法查看到jmp short s1这条代码。因为有的命令行工具可能不能够显示过多的代码。 我们可以从上图中找一个参照点,再次运用 u 命令,就可以看到这行代码了。从下图中,我们可以看到,jmp short s1对应的机器代码,正是 EB F6
完整的反编译代码
jmp short s1的跳转原理分析:
codesg segment
mov ax,4c00h ; 3字节
int 21h ; 2字节
start: mov ax,0 ; 3字节
s: jmp short s1 ; 2字节
; 上述4条指令总共加起来是10字节,即 10 个单位的偏移量!
; 由于 nop 只占一个字节 , 因此
; 原来 s 中的两个 nop 被jmp short s1完全替代。
; CPU首先读取这条指令到指令缓存器里
; 此时的ip为8(由上图可以知道)
; 【文末的参考文章中的len(EB F6)解释错误,应为2,此处已更正】
; 接下来 , (ip) = (ip) + len(EB F6) = (ip) + 2 = 10
; 然后执行这条指令 , 即为 (ip) = (ip) - 10 = 0
; 这样 ip 就回到了 code segment 的起始处
; 这样继续执行
mov ax,4c00h
int 21h
; 这样,程序就这样神奇的执行成功啦!!!