椋鸟C语言笔记#16：函数栈帧的创建与销毁

椋鸟Starling

已于 2023-11-16 22:29:37 修改

阅读量77

点赞数 2

分类专栏： C语言笔记文章标签：笔记 c语言开发语言

于 2023-11-10 17:00:46 首次发布

本文链接：https://blog.csdn.net/starlinglin/article/details/134232688

版权

C语言笔记专栏收录该内容

36 篇文章 1 订阅

订阅专栏

萌新的学习笔记，写错了恳请斧正。

函数栈帧是什么

函数栈帧(stack frame)就是函数调用过程中在程序的调用栈(call stack)所开的空间，这些空间
是用来存放：

函数参数和函数返回值
临时变量（括函数的非静态的局部变量以及编译器自动生产的其他临时变量）
保存上下文信息（包括在函数调用前后需要保持不变的寄存器）

栈是什么

准确定义：栈是只允许在一端进行插入或删除操作的线性表。

可以理解为栈是一种特殊的容器，用户可以将数据压入栈中（入栈，push），也可以将已经压入栈中的数据弹出（弹栈，pop），但是栈这个容器必须遵守一条规则: 先入栈的数据后出栈(First in Last Out)。就像一摞书，从顶上一本一本放书，也从顶上一本一本取书。

在计算机系统中，栈则是一个具有以上属性的动态内存区域。程序可以将数据压入栈中，也可以将数据从栈顶弹出。压栈操作使得栈增大，而弹出操作使得栈减小。

栈是非常非常非常重要的一个概念，可以说基本上所有的程序都使用了栈，我们看到的一切函数实现都基于栈。

栈的性质

在大多数操作系统中，栈都是从高地址向低地址延伸的。（也就是说后压入的数据地址更低）

在x86-32和x86-64下栈顶由寄存器esp来定位。

弹栈并不是把栈顶的数据删除，而是直接将栈顶指针（esp）回退一位。数据还在，但是没有意义了，下一个压入的数据会将其覆盖。（就像光标后移，也就是退格一样）

一些寄存器与汇编指令

寄存器

eax：通用寄存器，保留临时数据，常用于返回值
ebx：通用寄存器，保留临时数据
ebp：栈底寄存器
esp：栈顶寄存器
eip：指令寄存器，保存下一条指令的地址，便于调用函数后返回原址

汇编指令

mov：数据转移。mov a, b就是把b的值赋给a
lea：取有效地址。可以理解为专门传送地址的mov
push：数据入栈。在栈顶上方加入数据，并移动栈顶指针
pop：数据出栈。移动栈顶指针
sub：减法指令。sub a, b就是把b减到a中
add：加法指令。add a, b就是把b加到a中
call：函数调用指令。先压栈返回地址，再转入目标函数
jump：修改eip来转入目标函数
ret：恢复返回地址，压入eip

函数栈帧的创建与销毁

前置知识

每一次函数调用，都要为本次函数调用开辟空间，即函数栈帧空间。

这块空间由esp与ebp两个寄存器来维护

其中esp记录栈顶的位置，ebp记录栈底的位置

函数栈帧的实现方式在不同编译器上有所不同，但大体一致

函数的调用堆栈

在Visual Studio中，我们调试进入函数后可以打开函数的调用堆栈窗口，可以看到函数正在被哪个函数调用。在勾选显示外部代码后，我们可以发现其实主函数也是被其他函数调用的。这些函数都会开辟自己的栈帧空间。

准备环境

为了更好的观察函数栈帧，我们可以在项目的属性页中打开C/C++常规选项卡，把“支持仅我的代码调试”改为“否”（Visual Studio）

反汇编

在调试时，我们可以右键鼠标，点击“转到反汇编”，就能看到编译器在编译我们的代码时具体是如何用汇编实现的。

int main()
{
//函数栈帧的创建
010C1410  push        ebp  
010C1411  mov         ebp,esp  
010C1413  sub         esp,0E4h  
010C1419  push        ebx  
010C141A  push        esi  
010C141B  push        edi  
010C141C  lea         edi,[ebp+FFFFFF1Ch]  
010C1422  mov         ecx,39h  
010C1427  mov         eax,0CCCCCCCCh  
010C142C  rep stos    dword ptr es:[edi]
//main函数主体  
	int a = 1;
010C142E  mov         dword ptr [ebp-8],1  
	int b = 2;
010C1435  mov         dword ptr [ebp-14h],2  
	int c = Add(a, b);
010C143C  mov         eax,dword ptr [ebp-14h]  
010C143F  push        eax  
010C1440  mov         ecx,dword ptr [ebp-8]  
010C1443  push        ecx  
010C1444  call        010C10E1  
010C1449  add         esp,8  
010C144C  mov         dword ptr [ebp-20h],eax  
	printf("%d", c);
010C144F  mov         esi,esp  
010C1451  mov         eax,dword ptr [ebp-20h]  
010C1454  push        eax  
010C1455  push        10C5858h  
010C145A  call        dword ptr ds:[010C9114h]  
010C1460  add         esp,8  
010C1463  cmp         esi,esp  
010C1465  call        010C113B  
	return 0;
010C146A  xor         eax,eax  
}

函数栈帧的创建

上面就是main函数的反汇编代码，下面我们具体理解一下：

首先，在main函数被调用前，栈空间如图：

010C1410  push        ebp

第一步把ebp寄存器中的值进行压栈，也就是在栈顶压入此时ebp的值，同时上移栈顶指针esp

注意，是此时，ebp指针会变的。这里只是保存原先ebp的位置，便于main函数结束后还能正常回到上级函数。

现在栈空间如图：

010C1411  mov         ebp,esp

然后把esp的值赋值给ebp，所以现在ebp储存的地址就也变成了esp储存的地址

也就是说，ebp指向的位置和esp一致了，变成如下情况：

这时也就看出上一步压栈的作用了，不保存一下ebp的位置马上回不去上级函数了

010C1413  sub         esp,0E4h

然后将esp的值减去0E4h（十进制为228，记住这个数字！），也就是再把栈顶指向的位置上移228位（因为栈区内存从高地址向低地址演示，所以地址减去一个值其实是上移），而这样在esp与ebp之间空出的位置就是为主函数开辟的栈帧空间（具体开辟多少得看编译器和环境），这篇区域将存储main函数中的临时变量等。如图：

010C13C9  push        ebx  
010C13CA  push        esi  
010C13CB  push        edi

随后我们连续压入了3个值，分别是ebx、esi、edi三个寄存器的值。这一步操作功能与上面保存ebp的值的意义一致，因为这三个寄存器在函数调用过程中可能会变化，为了便于调用完函数时返回一开始的状态，就先保存一下。

此时栈空间如图：

010C141C  lea         edi,[ebp+FFFFFF1Ch]  
010C1422  mov         ecx,39h  
010C1427  mov         eax,0CCCCCCCCh  
010C142C  rep stos    dword ptr es:[edi]

这四句代码就比较难以理解了。

第一句是把ebp+FFFFFF1Ch（ebp-0E4h，这个数字是不是很熟悉？马上会剖析这里）的地址放入edi中（看，edi变了，所以上一步保存edi是有必要的）

然后将39h（十进制57）赋值给ecx，将0CCCCCCCCh赋值给eax。

最后这一句代码只需要理解意思就行，就是把从ebp到edi之间按顺序排ecx个的内存dword（32位2进制，就是8位16进制，对应4个字节）初始化为16进制的CCCCCCCC（不同编译器可能初始化的不一样）。

而0E4h正是之前创建栈帧空间是栈顶指针的偏移量，也就是栈帧空间中可用区域的大小

同时57*4就等于228，其实这里就是初始化了栈帧空间中的所有区域

四句连起来就是把main函数栈帧空间可用区域所有内存位置初始化为0xCCCCCCCC

那么现在的栈空间如图：

至此，函数栈帧就完成了创建。

关于“烫烫烫”

网络上我们可能看到“锟斤拷”、“烫烫烫”的梗，用来描述乱码。

而当我们写一个字符数组却忘记在结尾加上‘\0’时，如果我们打印这个数组便会看到一堆烫烫烫，这是为什么呢。

因为0xCC对应的汉字编码就是烫，而当打印数组没有读取到字符串结束标志时，就会一直读下去直到遇到一个‘\0’，而中途会读取到很多初始化了却还没有被使用的内存空间（值为0xCCCCCCCC），所以就会输出“烫”。

变量的创建与初始化

下面我们继续来看看主函数的核心代码，首先是局部变量创建的部分：

	int a = 1;
010C142E  mov         dword ptr [ebp-8],1  
	int b = 2;
010C1435  mov         dword ptr [ebp-14h],2

首先是把1放到了ebp-8的位置，2放在了ebp-14h的位置

很显然ebp-8,ebp-14h（ebp-20）就是函数用来存放局部变量a和b的地方

可以发现ebp-8就是栈底指针上方第二个内存位置（每个内存地址对应4字节）

而b与a间隔两个内存位置（如果再创建c也将与b间隔2个位置）

具体间隔多少取决于编译器的实现，并不统一

同时，我们能看出创建变量同时进行初始化的重要性。如果不初始化，其值是一个随机值（初始化函数栈帧时的值，这里是0xCCCCCCCC）

函数的调用与传参

接下来就是调用Add函数了

	int c = Add(a, b);
010C143C  mov         eax,dword ptr [ebp-14h]  
010C143F  push        eax  
010C1440  mov         ecx,dword ptr [ebp-8]  
010C1443  push        ecx

首先，编译器把ebp-14h（变量b）的值赋给了eax寄存器，eax压栈

同样的，把ebp-8（变量a）的值赋给了ecx寄存器，ecx压栈

其实啊，这两步就是创建形参的过程。我们调用函数时传递过去的其实就是刚刚压栈的eax与ecx，而不是a和b本身。这就是为什么说形参是实参的一份临时拷贝（后面Add函数栈帧销毁时会舍弃这部分形参的内存空间所以是“临时”）

下面，重要的一步来了：

010C1444  call        010C10E1

这就是正式开始调用函数了，内存跳转到010C10E1（以此为例）

而这个位置是编译器存放进入Add函数的指令的地方：

_Add:
010C10E1  jmp         010C13C0

跳转到这里我们发现我们需要进一步前往010C13C0（以此为例）

而010C13C0就是我本次编译时Add函数指令的位置

先不急着看Add函数内部的情况。

我们先跳过add函数，主函数调用add函数后还有两条指令：

010C1449  add         esp,8  
010C144C  mov         dword ptr [ebp-20h],eax

先是栈顶指针esp加8，也就是后退两位，这正好把之前放置形参ab的两个位置丢了出去（也就相当于连续两次pop）（注意栈中删除东西不是真的删除，只要使这个元素在栈指针外面即可，这样这个数据就没有意义了，后面这个位置再写入其他数据也无所谓）

然后编译器将寄存器eax（这里现在存着函数的返回值）的值赋给了ebp-20h的位置（局部变量c的位置）

至此，一次完整的函数调用就结束了。

Add函数-从创建函数栈帧到销毁

之前跳转过去的Add函数的反汇编代码如下：

int Add(int a, int b)
{
010C13C0  push        ebp  
010C13C1  mov         ebp,esp  
010C13C3  sub         esp,0CCh  
010C13C9  push        ebx  
010C13CA  push        esi  
010C13CB  push        edi  
010C13CC  lea         edi,[ebp+FFFFFF34h]  
010C13D2  mov         ecx,33h  
010C13D7  mov         eax,0CCCCCCCCh  
010C13DC  rep stos    dword ptr es:[edi]  
	int c = 0;
010C13DE  mov         dword ptr [ebp-8],0  
	c = a + b;
010C13E5  mov         eax,dword ptr [ebp+8]  
010C13E8  add         eax,dword ptr [ebp+0Ch]  
010C13EB  mov         dword ptr [ebp-8],eax  
	return c;
010C13EE  mov         eax,dword ptr [ebp-8]  
}
010C13F1  pop         edi  
010C13F2  pop         esi  
010C13F3  pop         ebx  
010C13F4  mov         esp,ebp  
010C13F6  pop         ebp  
010C13F7  ret

前面依旧是和main函数一致的函数栈帧的创建与变量的初始化，不再重复一遍了

过程如图：

然后，就又到了我们需要关注的内容：

	c = a + b;
010C13E5  mov         eax,dword ptr [ebp+8]  
010C13E8  add         eax,dword ptr [ebp+0Ch]  
010C13EB  mov         dword ptr [ebp-8],eax

我们可以看到，编译器在这里是通过ebp+8/ebp+0Ch来回去找到ab的形参所在的位置的（形参创建的位置在主调函数的末尾）

	return c;
010C13EE  mov         eax,dword ptr [ebp-8]

最终返回结果会被赋值给寄存器eax来带回主调函数。

最后，我们终于讲到了函数栈帧的销毁

010C13F1  pop         edi  
010C13F2  pop         esi  
010C13F3  pop         ebx

先是连续3次弹栈，分别存入edi、esi、ebx

010C13F4  mov         esp,ebp  
010C13F6  pop         ebp  
010C13F7  ret

然后将esp挪到ebp所指向位置（相当于把整个add函数除了栈头全部弹掉）

如图：

再弹出ebp2将其存入ebp（这样ebp就变回了原来维护主函数的ebp，因为当时这个值就被保存在了这里），而esp因为弹栈也后退一格返回了原本维护主函数的esp的位置。

最终ret指令返回主调函数call的位置，并执行调用函数的收尾工作。

我们再看一眼栈区，就会发现和调用函数之前有意义的部分完全一致

变化的只有获得了返回值

扩展

返回对象是内置类型时，一般都是通过寄存器来带回返回值

返回对象如果是较大的对象时，一般会在主调函数的栈帧中开辟一块空间，然后把这块空间的地址，隐式传递给被调函数，在被调函数中通过地址找到主调函数中预留的空间，将返回值直接保存到主调函数

参考《程序员的自我修养》第10章

这一期画图画的好累好累~

椋鸟Starling

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
1
评论
椋鸟C语言笔记#16：函数栈帧的创建与销毁

萌新的学习笔记，写错了恳请斧正。
复制链接

扫一扫

专栏目录

椋鸟C语言笔记#16：函数栈帧的创建与销毁

函数栈帧是什么

栈是什么

栈的性质

一些寄存器与汇编指令

寄存器

汇编指令

函数栈帧的创建与销毁

前置知识

函数的调用堆栈

准备环境

反汇编

函数栈帧的创建

关于“烫烫烫”

变量的创建与初始化

函数的调用与传参

Add函数-从创建函数栈帧到销毁

扩展

“相关推荐”对你有帮助么？