我们知道,程序执行的是二进制的指令,学名叫操作码。汇编语言是操作码的文本表示形式,一句汇编语言对应着一些二进制指令。大家好,我是HongBoXiong,致力于做一名受人膜拜的搬运工*_*,入门汇编,从此开始。
下面是一个简单的程序example.c:
int add_a_and_b(int a, int b) {
return a + b;
}
int main() {
return add_a_and_b(2, 3);
}
在X86指令集上编译这个程序,用$gcc -S example.c,会生成一个文本文件example.s,里面就是汇编语言,包含了几十行指令。
以下的汇编注释假设大家都懂进程的内存模型,大家都了解CPU的寄存器、缓存。example.s文件内容的注释如下:
_add_a_and_b://栈区中开辟一个帧结构用来代表该函数
push %ebx //将EBX 寄存器里面的值写入该帧,且在ESP寄存器中存原值-4
mov %eax, [%esp+8] //取ESP寄存器的值+8,放入eax寄存器,可知eax存的是2的地址
mov %ebx, [%esp+12]// 取ESP寄存器的值+12,放入ebx寄存器,可知ebx存的是3的地址
add %eax, %ebx //取寄存器中地址对应的值相加得5,把5放入eax寄存器
pop %ebx //从栈区中弹出最后一次写入的值,即该函数第一条指令下的写入值,且把该值再放回ebx寄存器,最后再在ESP寄存器中存原值+4
ret //终止当前函数的执行,讲分配的帧回收,将运行权交给上层函数
_main://在系统为该进程分配的内存中的栈区中开辟一个帧结构用来代表该函数
push 3//栈区从进程内存的高位开始分配,开辟4位字节空间存int3,且在ESP寄存器中存 栈区首地址-4
push 2//再开辟4位字节空间存int2,且在ESP寄存器中存 原值-4
call _add_a_and_b //指令调用进入该函数
add %esp, 8//在ESP寄存器中存 原值+8,即存的是栈区的首地址,即全部回收栈区内存
ret//退出该函数,退出该进程
程序退出,槽点无限。
出处:http://www.ruanyifeng.com/blog/2018/01/assembly-language-primer.html