原文地址 http://sudu.cn/info/html/edu/code/20070102/294464.html
理解调用栈最重要的两点是:栈的结构,EBP寄存器的作用。
右侧的红色部分,写出了引发栈结构变化的对应的指令
+| (栈底方向,高位地址) |
| ....................|
| ....................| // call somefun(...)-->修改esp,栈向下增长,参数入栈,返回值入栈
| 参数3 |
| 参数2 |
| 参数1 |
| 返回地址 |
-| 上一层[EBP] | // push ebp --->修改esp,栈向下增长
+| (栈底方向,高位地址) |
| ....................|
| ....................| // call somefun(...)-->修改esp,栈向下增长,参数入栈,返回值入栈
| 参数3 |
| 参数2 |
| 参数1 |
| 返回地址 |
-| 上一层[EBP] | // push ebp --->修改esp,栈向下增长
| 局部变量1 | // sub esp 局部变量占用空间 -->修改esp,栈向下增长
| 局部变量2 |
|.....................|
补充:栈一直随着函数调用的深入,一直想栈顶方向压下去。每次调用函数时候,先压函数参数(从右往左顺序压),再压入函数调用下条指令的地址(由call完成)。接着进入调用函数体中先执行PUSH EBP; MOV EBP ESP;(一般已经由编译器加入到函数头中了),接着就是吧函数体中的局部变量压入栈中。再遇到函数的调用的嵌套则依此类推。(added by smsong)
“PUSH EBP”“MOV EBP ESP”这两条指令实在大有深意:首先将EBP入栈,然后将栈顶指针ESP赋值给EBP。“MOV EBP ESP”这条指令表面上看是用ESP把EBP原来的值覆盖了,其实不然——因为给EBP赋值之前,原EBP值已被压栈(位于栈顶),而新的EBP又恰恰指向栈顶。
此时EBP寄存器就已处于一个很重要的地位,该寄存器中存储着栈中的一个地址(原EBP入栈后的栈顶),从该地址为基准,向上(栈底方向)能获取返回地址、参数值,向下(栈顶方向)能获取函数局部变量值,而该地址处又存储着上一层函数调用时的EBP值!
一般而言,ss:[ebp+4]处为返回地址,ss:[ebp+8]处为第一个参数值(最后一个入栈的参数值,此处假设其占用4字节内存),ss:[ebp-4]处为第一个局部变量,ss:[ebp]处为上一层EBP值。
由于EBP中的地址处总是“上一层函数调用时的EBP值”,而在每一层函数调用中,都能通过当时的EBP值“向上(栈底方向)能获取返回地址、参数值,向下(栈顶方向)能获取函数局部变量值”。
如此形成递归,直至到达栈底。这就是函数调用栈。
编译器对EBP的使用实在太精妙了。
从当前EBP出发,逐层向上找到任何的EBP是很容易的:
unsigned int _ebp;
__asm _ebp, ebp;
while (not stack bottom)
{
//...
_ebp = *(unsigned int*)_ebp;
}
假如要写一个简单的调试器的话,注意需在被调试进程(而非当前进程——调试器进程)中读取内存数据。
“PUSH EBP”“MOV EBP ESP”这两条指令实在大有深意:首先将EBP入栈,然后将栈顶指针ESP赋值给EBP。“MOV EBP ESP”这条指令表面上看是用ESP把EBP原来的值覆盖了,其实不然——因为给EBP赋值之前,原EBP值已被压栈(位于栈顶),而新的EBP又恰恰指向栈顶。
此时EBP寄存器就已处于一个很重要的地位,该寄存器中存储着栈中的一个地址(原EBP入栈后的栈顶),从该地址为基准,向上(栈底方向)能获取返回地址、参数值,向下(栈顶方向)能获取函数局部变量值,而该地址处又存储着上一层函数调用时的EBP值!
一般而言,ss:[ebp+4]处为返回地址,ss:[ebp+8]处为第一个参数值(最后一个入栈的参数值,此处假设其占用4字节内存),ss:[ebp-4]处为第一个局部变量,ss:[ebp]处为上一层EBP值。
由于EBP中的地址处总是“上一层函数调用时的EBP值”,而在每一层函数调用中,都能通过当时的EBP值“向上(栈底方向)能获取返回地址、参数值,向下(栈顶方向)能获取函数局部变量值”。
如此形成递归,直至到达栈底。这就是函数调用栈。
编译器对EBP的使用实在太精妙了。
从当前EBP出发,逐层向上找到任何的EBP是很容易的:
unsigned int _ebp;
__asm _ebp, ebp;
while (not stack bottom)
{
//...
_ebp = *(unsigned int*)_ebp;
}
假如要写一个简单的调试器的话,注意需在被调试进程(而非当前进程——调试器进程)中读取内存数据。
1、一个函数调用动作可分解为:零到多个PUSH指令(用于参数入栈),一个CALL指令。CALL指令内部其实还暗含了一个将返回地址(即CALL指令下一条指令的地址)压栈的动作。
2、几乎任何本地 编译器都会在每个函数体之前插入类似如下指令:PUSH EBP; MOV EBP ESP;
即,在程序执行到一个函数的真正函数体时,已有以下数据顺序入栈:参数,返回地址,EBP。
由此得到类似如下的栈结构(参数入栈顺序跟调用方式有关,这里以C语言默认的CDECL为例):
注意以下几个事实
1) 栈的变化仅当esp的值被改变
2)esp的值得变化仅当
1.1 发生在 push,pop的时候。
1.2 sub esp ,add esp eg: 刚进入一个函数时,为了给局部变量分配栈空间
3) push发生在
1)代码中显式的push,pop
2)call指令会让参数入栈调用push,会让返回值入栈,调用push
4) ebp的值发生仅在 刚进入一个函数时 push ebp esp
1.1 发生在 push,pop的时候。
1.2 sub esp ,add esp eg: 刚进入一个函数时,为了给局部变量分配栈空间
3) push发生在
1)代码中显式的push,pop
2)call指令会让参数入栈调用push,会让返回值入栈,调用push
4) ebp的值发生仅在 刚进入一个函数时 push ebp esp
2009.5.6日更新
最近两天在研究ATL,因为ATL使用了一些底层的技术 以及一些内联汇编语言来使它更小巧快速。
下面这篇文章讲给出汇编的一些很有用的信息,包括函数调用栈,函数返回值恢复栈等 ret指令等
参考:
http://hi.baidu.com/bingkafei_1200/blog/item/5702f122a1bd4af4d6cae268.html VC知識文庫 ATL布幔之下的秘密(4)
在学习windbg的过程中,其中codeproject上有一篇windbg_tutorial_part1 下面有一篇推荐文章,文章作者喜欢在没有源码的情况下用windbg调试程序,所以,文章对汇编也讲有。