“作为一名合格的程序员,汇编语言的知识是必不可少的。”
1、intel汇编与AT&T格式的汇编不同之处也知道也写,今天看到一条以前没见过的:
(变量)符号的地址以“$”开头,注意是变量的地址。
movl $var,%ebx
区别:movl var,%ebx
2、函数调用过程中,关于参数压栈,和返回后执行指令的地址。
伪码:
.globl fun
.type fun,@functionfun:
pushl %ebp
movl %esp,%ebp
subl $4,%esp
movl 8(%ebp),%eax
movl %eax,-4(%ebp)
movl $3,8(%ebp)
mov $4,12(%ebp)
...
.globl main
.type main,@function
main:
...
movl $100,(%esp)
movl $200,4(%esp)
call fun
movl $0,%eax
...
上面代码中,由于4(%ebp)中放置的是从fun函数返回后执行的第1条指令的地址(该地址由“call fun”自动压栈),所以在fun函数中取两个参数时的地址时是
movl $3,8(%ebp)
mov $4,12(%ebp)。
3、在函数调用过程中,为什么不直接使用esp寻址栈里面的数据,而要先保存ebp,在用ebp存放esp,在通过ebp来寻址?
其实直接用esp寻址也是可以的,只是gcc默认输出的汇编代码是用ebp寻址,而用esp勾画整个函数的栈空间。这样代码比较清晰。如果要追求高效,如在编译linux内核时,其内部函数就是直接用esp寻址的。可以用编译选项指示GCC直接用esp寻址:
$gcc -fomit -frame -poin
===============================
movl %ebp, %ecx
subl $8, %ecx
movl -8(%ebp), %ecx 此句相当于 intel asm 里的 : mov ecx, [ebp-8]
movl (%ebp, %eax), %ecx 此句相当于 intel asm 里的 : mov ecx, [ebp+eax]
movl (%ebp, %eax, 4), %ecx 此句相当于 intel asm 里的 : mov ecx, [ebp+eax*4]
movl -8(%ebp, %eax, 4), %ecx 此句相当于 intel asm 里的 : mov ecx, [ebp+eax*4-8]
一般情况下,外部变量可以被所有的文件访问,要使一个变量既存放在数据段,有不会被其他文件的代码看到,就要改变外部变量的链接性质,即使用static,这种情况下,用static 修饰全局变量定义时,产生的汇编代码中和一般的全局变量相比少了.globl var 一句。而用static 修饰全局变量暂时定义时,和没加static时相比,多了一句.local var
在上面两种情况下,如果使用static前后(特别是声明与定义)不一致,则会发生冲突,应特别注意。
上面说到了,static可以改变全局(外部)变量和函数的链接性质,而对内部变量使用static,则可以改变内部变量的存储性质。即这种变量存放在数据段中,但只具有普通内部变量的可见范围。
对于gcc编译器,对静态内部变量产生的汇编代码为(假设var为该静态内部变量):
.data
.align 4
.type var.0,@object
.size var.0,4
var.0:
.long 0 ;用0初始化
可以看出,该变量的名字被编译器作了点小动作,这是因为可能会在多个函数内部定义相同名称的静态内部变量,为了区分它们,需要给与不同的名字。