汇编语言小节

最新推荐文章于 2022-04-13 13:32:05 发布

zheng80037

最新推荐文章于 2022-04-13 13:32:05 发布

阅读量548

点赞数

文章标签：汇编语言 fun linux内核 gcc 编译器

“作为一名合格的程序员，汇编语言的知识是必不可少的。”

1、intel汇编与AT&T格式的汇编不同之处也知道也写，今天看到一条以前没见过的：

（变量）符号的地址以“$”开头，注意是变量的地址。

movl $var,%ebx

区别：movl var,%ebx

2、函数调用过程中，关于参数压栈，和返回后执行指令的地址。

伪码：

.globl fun

.type fun,@function

fun:

pushl %ebp

movl %esp,%ebp

subl $4,%esp

movl 8(%ebp),%eax

movl %eax,-4(%ebp)

movl $3,8(%ebp)

mov $4,12(%ebp)

...

.globl main

.type main,@function

main:

...

movl $100,(%esp)

movl $200,4(%esp)

call fun

movl $0,%eax

...

上面代码中，由于4(%ebp)中放置的是从fun函数返回后执行的第1条指令的地址（该地址由“call fun”自动压栈），所以在fun函数中取两个参数时的地址时是

movl $3,8(%ebp)

mov $4,12(%ebp)。

3、在函数调用过程中，为什么不直接使用esp寻址栈里面的数据，而要先保存ebp，在用ebp存放esp，在通过ebp来寻址？

其实直接用esp寻址也是可以的，只是gcc默认输出的汇编代码是用ebp寻址，而用esp勾画整个函数的栈空间。这样代码比较清晰。如果要追求高效，如在编译linux内核时，其内部函数就是直接用esp寻址的。可以用编译选项指示GCC直接用esp寻址：

$gcc -fomit -frame -poin

===============================

1、再说些关于AT&T格式的汇编：

mov ecx, ebp-8, 重写后的代码由一句变成了两句 :
movl %ebp, %ecx
subl $8, %ecx

在 AT&T 的汇编语法中 , 对于双寄存器寻址的操作 , 不能对寄存器取的值作任何变换 , 也就是说不能写成 "movl %ebp-8, %ecx" 的形式 , 而寄存器间接寻址的操作就可以作变换 , 比如 :
movl -8(%ebp), %ecx             此句相当于 intel asm 里的 :   mov ecx, [ebp-8]
movl (%ebp, %eax), %ecx         此句相当于 intel asm 里的 :   mov ecx, [ebp+eax]
movl (%ebp, %eax, 4), %ecx      此句相当于 intel asm 里的 :   mov ecx, [ebp+eax*4]
movl -8(%ebp, %eax, 4), %ecx    此句相当于 intel asm 里的 :   mov ecx, [ebp+eax*4-8]

2、全局变量存放在数据段中（ data segment ），这些数据的地址在程序进行链接的时候就已经算出，并且从程序开始到结束都是相同的，所以任何函数都能访问这些数据。

既没有初始化又没有extern的全局变量语句是“暂时定义”（tentative definition）。在汇编代码中，这种情况与一般全局变量的定义的区别是：

暂时定义：.comm var 4,4 ;4字节对齐，大小为4字节

一般定义：

.globl var

.data

.align 4

.type var,@object

.size var,4

var:

.long 0 ;用0初始化

3、外部变量的链接性质。
一般情况下，外部变量可以被所有的文件访问，要使一个变量既存放在数据段，有不会被其他文件的代码看到，就要改变外部变量的链接性质，即使用static，这种情况下，用static 修饰全局变量定义时，产生的汇编代码中和一般的全局变量相比少了.globl var 一句。而用static 修饰全局变量暂时定义时，和没加static时相比，多了一句.local var
在上面两种情况下，如果使用static前后（特别是声明与定义）不一致，则会发生冲突，应特别注意。

4、静态内部变量。
上面说到了，static可以改变全局（外部）变量和函数的链接性质，而对内部变量使用static，则可以改变内部变量的存储性质。即这种变量存放在数据段中，但只具有普通内部变量的可见范围。
对于gcc编译器，对静态内部变量产生的汇编代码为（假设var为该静态内部变量）：
.data
.align 4
.type var.0,@object
.size var.0,4
var.0:
.long 0 ;用0初始化
可以看出，该变量的名字被编译器作了点小动作，这是因为可能会在多个函数内部定义相同名称的静态内部变量，为了区分它们，需要给与不同的名字。