关于对栈的理解,相信很多人和我一样都是很模糊的。在昨天阅读数据的时候,看到对这方面的介绍,便写个这个博客来和大家分享下。希望对大家有所帮助。
栈,是硬件,主要作用表现为一种数据结构,是只能在一端插入和删除数据的特殊线性表。允许进行插入和删除操作的一端称为栈顶,另一端为栈底。栈按照后进先出的原则存储数据,最先进入的数据被压入栈底,最后进入的数据在栈顶,需要读数据时从栈顶开始弹出数据。栈底固定,而栈顶浮动。栈中元素个数为零时称为空栈。插入一般称为进栈(p u s h ),删除则称为出栈(p o p )。 栈也被称为先进后出表,在函数调用的时候用于存储断点,在递归时也要用到栈。
在计算机系统中,栈则是一个具有以上属性的动态内存区域。程序可以将数据压入栈中,也可以将数据从栈顶弹出。在i 3 8 6 机器中,栈顶由称为e s p 的寄存器进行定位。压栈的操作使栈顶的地址减小,弹出的操作使栈顶的地址增大。 栈在程序的运行中有着举足轻重的作用。最重要的是,栈保存了一个函数调用时所需要
的维护信息,这常常被称为堆栈帧。栈一般包含以下两方面的信息:
1 )函数的返回地址和参数。
2 )临时变量:包括函数的非静态局部变量及编译器自动生成的其他临时变量。
堆,是一种动态存储结构,实际上就是数据段中的自由存储区,它是C 语言中使用的一种名称,常常用于存储、分配动态数据。堆中存入的数据地址向增加方向变动。堆可以不断进行分配直到没有堆空间为止,也可以随时进行释放、再分配,不存在顺序问题。堆内存的分配常通过m a l l o c ( ) 、c a l l o c ( ) 、r e a l l o c ( ) 三个函数来实现。而堆内存的释放则使用f r e e ( ) 函数。
堆和栈在使用时“生长”方向相反,栈向低地址方向“生长”,而堆向高地址方向“生长”。
#include <stdio.h>
void print()
{
// 填充代码
}
int main()
{
int a=1;
int b=2;
char c='c';
int arr[]={11,12,13,14,15,16,17};
print();
return 0;
}
看看上面的代码和相关要求,可能会让很多读者束手无策,如果能联系前面的知识点,就应该想到用栈。那么我们该如何来解决问题呢?先别急,在讲解之前,我们先来回顾几个知识点。
1 )p u s h 操作先移动栈顶指针,之后将信息入栈。
2 )e s p 为堆栈指针,栈顶由e s p 寄存器来定位。压栈的操作使栈顶的地址减小,弹出的操作使栈顶的地址增大。
3 )e b p 是3 2 位的b p ,是基址指针。b p 为基指针寄存器,用它可直接存取堆栈中的数据,它在调用函数时保存e s p ,以便函数结束时可以正确返回。
4 )默认的函数内部变量的压栈操作为:从上到下、从左向右,采用4 字节对齐。数组压栈方法略有不同,即从最后一个元素开始,直到起始元素为止,即采用从右向左的方法压栈。
函数的开头都有如下两句汇编指令:
push ebp
mov ebp,esp
为了使读者易于理解,在此通过图1 - 1 来分析说明。根据图上的标注,函数开头部分的第一个p u s h 指令的操作步骤是,首先移动栈顶指针e s p ,然后将e b p 内容压栈,注意此时压栈的e b p 的值为上一个函数的e s p 的值, 而e s p 恰好就是上一个函数的栈底,所以每个函数一开始的p u s h 指令就是保存上一个函数的栈底。那么接下来的m o v 指令有什么作用呢?由于e s p 是当前的栈顶指针,所以该指令的作用就是保存当前栈顶指针的值。由此就可以分析出,e b p 存放的是此刻栈顶的地址,就是说,e b p 是一个指针,指向栈顶,而栈顶存放的数据其实是上一个函数的e b p 的值,即上一个函数的栈底。
通过上面的分析可知,e b p 压栈后,接着就是函数中临时变量的压栈操作,由此可知,我们只需要在p r i n t ( ) 函数中得到m a i n ( ) 函数的栈底,就可以取出数组中的每个元素了,看看下面的实现方法。
#include <stdio.h>
void print()
{
unsigned int _ebp;
__asm{
mov _ebp,ebp
}
int *p=(int *)(*(int *)_ebp-4-4-4-7*4);
for(int i=0;i<7;i++)
printf("%d\t",p[i]);
}
int main()
{
int a=1;
int b=2;
char c='a';
int arr[]={11,12,13,14,15,16,17};
print();
return 0
}
注:关于GCC内联汇编代码编译,有知道的大哥给指点下:这个网上也没有搜索到具体如何编译。知道的麻烦给回复下
在没有传递任何参数的情况下,成功地在p r i n t ( ) 函数中打印出了m a i n ( ) 函数中a r r 数组内的每个元素。现在来看看上面代码的实现方法,在p r i n t ( ) 函数中定义了一个_ e b p 无符号整型变量,通过V C + + 6 . 0 内嵌汇编把e b p 的值保持到_ e b p 中,按照上面的分析,可以将在函数p r i n t ( ) 中通过这条内嵌汇编语句得到的e b p 看成一个指针,指针所指向的单元存放的就是p r i n t ( ) 函数的上一个函数的栈底,在此是m a i n ( ) 函数的栈底。知道了_ e b p 的作用后,我们来分析下代码,通过( i n t * ) _ e b p 将_ e b p 转换为一个整型指针,然后通过* ( i n t * ) _ e b p 即可得到m a i n ( ) 函数的栈底地址。由于栈的压栈操作是从上到下、从右到左的,所以m a i n ( ) 函数中的变量a 先压栈,然后是b 、c ,最后是a r r 数组,数组的压栈顺序是从右到左。通过“i n t * p = ( i n t * ) ( * ( i n t * ) _ e b p - 4 - 4 - 4 - 7 * 4 ) ; ”即可得到数组元素的首地址。接下来,根据首地址就可以取出数组中的每个元素了。有的读者可能会有一个疑惑,m a i n ( ) 函数中有一个字符型变量,是不是在求数组元素的首地址时应该把其中的减4 改为减1 呢?因为它只占用了一个字节!即将“i n t * p = ( i n t * ) ( * ( i n t * ) _ e b p - 4 - 4 - 4 - 7 * 4 ) ; ”修改为“i n t * p = ( i n t * ) ( * ( i n t * ) _ e b p - 4 - 4 - 1 -7 * 4 ) ”。我们暂且不说其对与错,先来看看修改后的运行结果:3072 3328 3584 3840 4096 4352 -859021056
我们发现这样的运行结果是错误的,为什么呢?细心的读者可能发现了本章一开始回顾的知识点中有一点是很重要的,那就是压栈操作为4 字节对齐。所以这里必须减4 ,而不是减1
-------------------------------------------------------------以上是书本原话介绍---------------------------------------
阅读完上面的代码应该会对栈有一定的了解。下面简单介绍下可执行程序在内存中的布局!
数据段包含经过初始化的全局和静态变量及他们的数值。BSS段的大小从可执行程序中得到,然后又连接器得到这个大小的内存块,紧跟在数据段的后面。当这个内存区进行程序的地址空间后全部清零。包括数据段和BSS段的整个区域统称为数据区。值得说明的是局部变量并未编译到可执行程序中,是在程序运行时执行的。