本节我们重点讨论栈指针esp和帧指针ebp,围绕这两个重要的寄存器,推导出函数栈帧结构。
一:压栈和出栈的操作本质(文中压栈等价于入栈)
上一节我们了解到push和pop是汇编中压栈和出栈的指令。栈这个东东,当某个程序运行时,会划分一块固定大小的区域(存储器映射),而栈就属于这个区域的一部分。要了解出入栈首先要了解栈的结构:
地址 栈中内容
最大地址 | 数据(栈底) |
…… | …… |
0x108 | 数据3 |
0x104 | 数据2 |
0x100 %esp |
数据1(栈顶) |
%FC 新%esp |
数据0 (新栈顶) |
从上图看出,栈的增长方向是向下的。栈有个最大地址,这个地址成为栈底,也是栈里面存储第一个元素的位置,随着入栈个数增加,栈顶的地址不断减小。感觉栈就像剩余停车位,随着进入的新车辆越多,剩余停车位就越少,%esp减到0表示停满。
esp寄存器就专门用来存储栈顶地址。关于栈是向下生长的理解:想象你被倒挂着,头就是你的栈顶,脚为栈底,地址就是海拔高度,此时你的脚肯定比头高。每压一次栈你身体就变长4厘米,头的高度就变矮,离地面越近,当长到你头撞地面时就压不动栈了。当然出栈就是你变短,头部的高度增加。%esp专门存储头部高度。
上述是本人原创的形象理解,不过有同事说我这种重口味比喻感觉深受虐待呼吸困难脑袋充血——本来已经很烧脑了何必呢?我只能说sorry也许我就是一个重口味的人:)试想当你苦苦研究地址空间原理时,有个比你还惨一个叫栈的倒霉蛋被这么倒挂着,自己还不能决定自己的身高,别提多解气了O(∩_∩)O~
在汇编中,%esp读出栈顶地址,(%esp)就能读出栈顶里的数值。如上图所示,如果再进行一次入栈push操作时,那么栈顶%esp就跳到地址0xFC(0x100-0x4)处,新压的数据也会存在这个地址上。如果上图不执行push,而是直接执行pop出栈时,%esp就跳到地址0x104。
push和pop这两个汇编操作指令,是可以用基本的汇编操作代替的,事实上,push和pop在汇编中对应的操作是:
push %ebp:
subl$4, %esp
movl %ebp, (%esp)
pop %eax:
movl (%esp), %eax
addl $4, %esp
在分析上面汇编代码之前再复习一下,%eax直接获取里面的值,(%eax)类似C指针‘*’间接寻址操作,是取出%eax里的值作为地址来看,再根据这个地址找到相应位置,并取出其中的值。至于为什么举例压栈%ebp,出栈%eax,这个完全处于需求。