1、运行栈工作原理
C++变量在运行时依靠地址加以区分。变量的定义全部写在函数以外,这样的变量叫做全局变量。变量的定义放在一个函数之内,这样的变量叫做局部变量。
全局变量,在目标代码中都是用一个唯一确定的地址定位的。然而,对于全局变量却不能如此,这是因为:
(1)局部变量只在调用它所在的函数时才会生效,一旦函数返回后就会失效。很多局部变量的生存周期远小于整个程序的运行周期,如果为每个局部变量分配不同的空间,则空间的利用率会降低。
(2)更重要的问题是,当发生递归调用时,会存在当一个函数尚未返回,对它的另一次调用又发生的情况,对于这种多次调用,相同名称的局部变量会有不同的值,这些值必须同时保存在内存之中,而且不能互相影响,因此它们必然有不同的地址,像全局变量那样分配唯一确定的地址肯定是行不通的。
函数形参的情形,与局部变量非常相似,他们都不能像全局变量那样用固定地址加以定位,而需要存储在一种特殊的结构中,这就是栈。
一般意义上的栈,是一种数据结构,它是一种能够容纳很多数据的容器,但数据进入和退出这个容器的顺序,要满足一定的要求。我们先来回忆一个生活中常见的例子:假设餐厅里有一摞盘子,如果要从中拿取盘子只能从最上面一个开始拿,当我们要再放上一个盘子时也只能放在最上面。栈的结构正是如此。每个盘子就相当于栈中的一个数据,数据只能从栈的一端存入(叫”压入栈“),只能从栈的同一端取出(叫”弹出栈“),这一端叫做栈顶,而栈的另一端叫做栈底,栈中数据的添加和删除操作具有”后进先出“的特性,也就是,栈中所有的数据,越早被压入的(接近栈底的),就越晚被弹出。
例子 输入两个整数,求他们的平方和
#include<iostream>
using namespace std;
int fun2(int m)
{
return m*m;
}
int fun1(int x,int y)
{
return fun2(x)+fun2(y);
}
int main()
{
int a,b;
cout<<"Please enter two integers(a and b):”<<endl;
cin>>a>>b;
cout<<"The sum of square of a and b:“<<fun1(a,b)<<endl;
return 0;
}
其中的嵌套调用,最早开始执行的是main函数,main函数调用fun1函数,fun1函数两次调用fun2函数,第二次对fun2的调用返回后,对fun1的调用才能返回,最后main才能返回。容易发现,一组嵌套的函数调用的特点是,越早开始的调用,返回的越晚。函数调用中的形参和局部变量,当调用时开始生效,当函数返回时即失效,它们有效的期间和函数调用的期间是重合的。这样,对于一组嵌套的函数调用中的一次调用,其形参和局部变量生效的时间越早,失效的时间就越晚。,这刚好满足”后进先出“的要求。这样,很自然地,函数的形参和局部变量,可以用栈来存储,这种栈叫做运行栈。
运行栈实际上是一段区域的内存空间,与存储全局变量的空间无异,只是寻址的方式不同而已。运行栈中的数据分为一个一个栈帧,每个栈帧对应一次函数调用,栈帧中包括这次函数调用中的形参值,一些控制信息、局部变量值和一些临时数据(例如复杂表达式计算的中间值、某些函数的返回值)。每次发生函数调用时,都会有一个栈帧被压入运行栈中,而调用返回后,相应的栈帧会被弹出。一个函数在执行过程中能够直接随机访问它所对应的栈帧中的数据,即处在运行栈最顶端的栈帧的数据(执行中的函数的栈帧,总处在运行栈的最顶端)。当一个函数调用其它函数时,要为它所调用的函数设置实参,具体方式是在调用前把实参值压入栈中,运行栈中的这一部分空间是主调函数与被调函数都可以直接访问的,参数的形实结合就是通过访问这一部分公共空间完成的。虽然一个函数在被调用时的形参和局部变量地址是不确定的,但它们的地址相对于栈顶地址却是确定的,这样就可以通过栈顶的地址,定位形参和局部变量。
2.函数调用的执行过程
在将数据压入和弹出运行栈、确定要访问的形参和局部变量的地址时,都需要获得栈顶的地址,因此需要有一个专门的存储单元记录栈顶地址。在IA-32中,esp寄存器就是用来记录栈顶地址的,它称为栈指针。
但只有一个寄存器存储栈顶地址,有时还不够用,因为有些函数的栈帧大小是不确定的,这就会在函数返回前恢复栈指针时遇到麻烦,因此还需要使用另一个寄存器保存函数刚被调用时栈指针的位置。在IA-32中这一任务是由ebp寄存器来完成的,它称为帧指针。另外,由于形参和局部变量相对于帧指针的位置肯定是确定的,函数的形参和局部变量的地址常常通过帧指针来计算,而非栈指针。
我们考虑下面一个简单的函数:
int add(int a,int b)
{
int c=a+b;
return c;
}
在另外某个函数中用下面的代码对它进行调用:
int x=add(5,7);
主调函数的这段代码对应的汇编代码如下:
8048459: mov1 $0x7,0x4(%esp) //将整数7写入esp+4地址中
8048461: mov1 $0x5,(%esp) //将整数5写入esp地址中
8048468: call 8048434 //调用8048434地址的函数
804846d: mov %eax,-0x8(%ebp) //将eax的值写入ebp-8地址中