从汇编角度看函数调用过程

本文以一个简单的程序为例,通过汇编代码查看函数调用过程,涉及如何开辟栈帧,函数如何返回等

#include <iostream>
using namespace std;

int sum(int a, int b)
{
	int temp = 0;
	temp = a + b;
	return temp;
}

int main()
{
	int a = 10;
	int b = 20;
	int ret = sum(a, b);
	cout << "ret: " << ret << endl;
	return 0;
}

代码非常简单,调用一个sum函数计算两数之和。

下面通过vs2017调试代码,看看代码编译成汇编指令后,是如何开辟栈帧及函数调用的。

(通过vs调试时记得把编译优化选项关了)

这是main函数部分汇编代码:

int main()
{
00271630  push        ebp  
00271631  mov         ebp,esp  
00271633  sub         esp,0Ch  
	int a = 10;
00271636  mov         dword ptr [ebp-8],0Ah  
	int b = 20;
0027163D  mov         dword ptr [ebp-4],14h  
	int ret = sum(a, b);
00271644  mov         eax,dword ptr [ebp-4]  
00271647  push        eax  
00271648  mov         ecx,dword ptr [ebp-8]  
0027164B  push        ecx  
0027164C  call        00271610  
00271651  add         esp,8  
00271654  mov         dword ptr [ebp-0Ch],eax 
	cout << "ret: " << ret << endl;
    //.....
}

(vs可能会用变量名代替地址,比如mov dword ptr [a],0Ah,只需要右键取消勾选显示符号名即可看到源地址)

可以看到进入main函数做的第一件事就是开辟栈帧,push ebp将栈底指针压栈,mov ebp esp将·esp复制给ebp,即将栈底指针指向栈顶,sub esp,0Ch栈顶指针减去0Ch,实则就是开辟栈空间。(栈向低地址增长)
在这里插入图片描述
随后将0Ah赋值给dword ptr[ebp-8]0Ah是10,也就是a变量,b同理。
在这里插入图片描述
接着调用sum函数,在调用函数之前这里进行了参数压栈操作,先将b的值给到eax,再进行压栈,a同理。
在这里插入图片描述
看到这里我们可以得出一个结论,参数是在函数调用方压栈的。

下面的call指令,调用sum函数,值得注意的是,调用call函数之前会将call后面的指令地址(00271651)压栈,为了在函数返回时继续向下执行。
在这里插入图片描述
进入到sum函数,这是sum函数汇编代码:

int sum(int a, int b)
{
00271610  push        ebp  
00271611  mov         ebp,esp  
00271613  push        ecx  
	int temp = 0;
00271614  mov         dword ptr [ebp-4],0  
	temp = a + b;
0027161B  mov         eax,dword ptr [ebp+8]  
0027161E  add         eax,dword ptr [ebp+0Ch]  
00271621  mov         dword ptr [ebp-4],eax  
	return temp;
00271624  mov         eax,dword ptr [ebp-4]  
}
00271627  mov         esp,ebp  
00271629  pop         ebp  
0027162A  ret  

在sum函数中,先将ebp压栈,再让ebp指向esp的位置。后将ecx压栈:
在这里插入图片描述
再往下mov dword ptr [ebp-4],0 ecx的位置赋为0。mov eax,dword ptr [ebp+8]ebp + 8刚好指向a的位置,将a的值移到eax寄存器中。add eax,dword ptr [ebp+0Ch]连加上b的值,存放在eax中。mov dword ptr [ebp-4],eaxeax的值移到ebp - 4的位置,最后在函数返回时,mov eax,dword ptr [ebp-4]将结果存放在eax寄存器中。之后进行函数返回的操作,mov esp,ebp
在这里插入图片描述
pop ebp,弹出值给到ebp,而现在栈顶的值刚好是之前保存的ebp的值:
在这里插入图片描述
ret指令首先弹出栈顶元素,并把弹出的内容放到PC寄存器中:
在这里插入图片描述
PC寄存器中存放的是下一条要执行的指令的地址,一个神奇的事情是,刚刚弹出的地址(00271651)刚好是call指令的下一条指令,也就是执行完sum函数后的下一条指令。这也就解释了函数调用完是怎么接着往后执行的。

回到main函数中,add esp,8将栈顶指针加8,回退栈顶指针,“回收”临时的函数参数。
在这里插入图片描述
这时回到最初的起点,mov dword ptr [ebp-0Ch],eax将计算所得的结果给到dword ptr [ebp-0Ch]。至此函数执行完成。可见,其实并不复杂,当然示例比较简单,但道理都一样。清楚了整个函数调用过程,或许就能更好理解为什么不要返回局部变量的地址?

int *fun()
{
	int temp = 5;
	return &temp;
}

int main()
{
	int *p;
	p = fun();//为什么不要这样做?
	cout << *p << endl;
	return 0;
}

因为在函数执行完成后,栈帧已经交还给了系统,虽然这时可以得到正确结果,但这只是因为系统没有对栈帧内容清空。

如果在打印*p之前调用一下函数sum(1, 2),这时结果就是不确定的了。

int main()
{
	int *p;
	p = fun();
	sum(1, 2);
	cout << *p << endl;
	return 0;
}
//输出8322272

所以不要返回局部变量地址,即便当时程序没有报错!!!

清楚了整个函数调用过程,或许就能更好理解为什么有时未初始化的数据在调试模式下显示“烫”或者“屯”,这是因为,开辟的栈空间的每一个字节默认初始化为0xCC,而0xCCCC的汉字编码就是“烫”。有时编译器还会使用0xCDCD来初始化,这时看到的就是“屯”。

清楚了整个函数调用过程,或许就能更好理解栈非法访问以及爆栈的问题(一个进程的栈空间默认为8M左右,可以修改大小,记得之前面试被问过这个问题)。

看看ChatGPT给出的解释:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

高二的笔记

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值