C语言-堆和栈的生长方向

最新推荐文章于 2022-06-02 11:45:53 发布

hang-7788

最新推荐文章于 2022-06-02 11:45:53 发布

阅读量981

点赞数 2

分类专栏： C语言文章标签：堆栈生长方向

C语言专栏收录该内容

71 篇文章 3 订阅

订阅专栏

转自 https://blog.csdn.net/u012569119/article/details/47776845

如何判断栈的增长方向？

对于一个用惯了i386系列机器的人来说，这似乎是一个无聊的问题，因为栈就是从高地址向低地址增长。不过，显然这不是这个问题的目的，既然把这个问题拿出来，问的就不只是i386系列的机器，跨硬件平台是这个问题的首先要考虑到的因素。

在一个物质极大丰富的年代，除非无路可退，否则我们坚决不会使用汇编去解决问题，而对于这种有系统编程味道的问题，C是一个不错的选择。那接下来的问题就是如何用C去解决这个问题。

C在哪里会用到栈呢？稍微了解一点C的人都会立刻给出答案，没错，函数。我们知道，局部变量都存在于栈之中。似乎这个问题立刻就得到了解答，用一个函数声明两个局部变量，然后比较两个变量的地址，这样就可以得到答案。

等一下，怎么比较两个变量的地址呢？

先声明的先入栈，所以，它的第一个变量的地址如果是高的，那就是从上向下增长。“先声明的先入栈”？这个结论从何而来？一般编译器都会这么处理。要是不一般呢？这种看似正确的方法实际上是依赖于编译器的，所以，可移植性受到了挑战。

那就函数加个参数，比较参数和局部变量的位置，参数肯定先入栈。那为什么不能局部变量先入栈？第一反应是怎么可能，但仔细想来又没有什么不可以。所以，这种方法也依赖于编译器的实现。

那到底什么才不依赖于编译器呢？

不妨回想一下，函数如何调用。执行一个函数时，这个函数的相关信息都会出现栈之中，比如参数、返回地址和局部变量。当它调用另一个函数时，在它栈信息保持不变的情况下，会把它调用那个函数的信息放到栈中。

似乎发现了什么，没错，两个函数的相关信息位置是固定的，肯定是先调用的函数其信息先入栈，后调用的函数其信息后入栈。那接下来，问题的答案就浮出了水面。

比如，设计两个函数，一个作为调用方，另一个作为被调用方。被调用方以一个地址（也就是指针）作为自己的入口参数，调用方传入的地址是自己的一个局部变量的地址，然后，被调用方比较这个地址和自己的一个局部变量地址，由此确定栈的增长方向。

给出了一个解决方案之后，我们再回过头来看看为什么之前的做法问题出在哪。为什么一个函数解决不了这个问题。前面这个大概解释了函数调用的过程，我们提到，函数的相关信息会一起送入栈，这些信息就包括了参数、返回地址和局部变量等等，在计算机的术语里，有个说法叫栈帧，指的就是这些与一次函数调用相关的东西，而在一个栈帧内的这些东西其相对顺序是由编译器决定的，所以，仅仅在一个栈帧内做比较，都会有对编译器的依赖。就这个问题而言，参数和局部变量，甚至包括返回地址，都是相同的，因为它们在同一个栈帧内，它们之间的比较是不能解决这个问题的，而它们就是一个函数的所有相关信息，所以，一个函数很难解决这个问题。

好了，既然有了这个了解，显然可以扩展一下前面的解决方案，可以两个栈帧内任意的东西进行比较，比如，各自的入口参数，都可以确定栈的增长方向。

狂想一下，会不会有编译器每次专门留下些什么，等下一个函数的栈帧入栈之后，在把这个留下的东西入栈呢？这倒是个破坏的好方法。如果哪位知道有这么神奇的编译器，不妨告诉我。我们可以把它的作者拉过来打一顿，想折磨死谁啊！

#include<stdio.h>

void func1();
void func2(int *a);

void func1()
{
    int a=0;
    func2(&a);
}
void func2(int *a)
{
    int b=0;
    printf("%x\n%x\n",a,&b);
}
int main()
{
    func1();
}

结果：

29f6ac
29f5c8
请按任意键继续. . .

可以看到，a>b;说明生长方向向上。电脑中栈的增长方向是由高地址向低地址方向增长的。

为什么栈向下增长？

“这个问题与虚拟地址空间的分配规则有关，每一个可执行C程序，从低地址到高地址依次是：text，data，bss，堆，栈，环境参数变量；其中堆和栈之间有很大的地址空间空闲着，在需要分配空间的时候，堆向上涨，栈往下涨。”

这样设计可以使得堆和栈能够充分利用空闲的地址空间。如果栈向上涨的话，我们就必须得指定栈和堆的一个严格分界线，但这个分界线怎么确定呢？平均分？但是有的程序使用的堆空间比较多，而有的程序使用的栈空间比较多。所以就可能出现这种情况：一个程序因为栈溢出而崩溃的时候，其实它还有大量闲置的堆空间呢，但是我们却无法使用这些闲置的堆空间。所以呢，最好的办法就是让堆和栈一个向上涨，一个向下涨，这样它们就可以最大程度地共用这块剩余的地址空间，达到利用率的最大化！！

呵呵，其实当你明白这个原理的时候，你也会不由地惊叹当时设计计算机的那些科学家惊人的聪明和智慧！！

（堆栈方向相反极小情况会发生的问题，堆栈重叠）。

为什么要把堆和栈分开？

为什么要把堆和栈区分出来呢？栈中不是也可以存储数据吗？

第一，从软件设计的角度看，栈代表了处理逻辑，而堆代表了数据。
这样分开，使得处理逻辑更为清晰。分而治之的思想。这种隔离、模块化的思想在软件设计的方方面面都有体现。
第二，堆与栈的分离，使得堆中的内容可以被多个栈共享（也可以理解为多个线程访问同一个对象）。这种共享的收益是很多的。一方面这种共享提供了一种有效的数据交互方式(如：共享内存)，另一方面，堆中的共享常量和缓存可以被所有栈访问，节省了空间。
第三，栈因为运行时的需要，比如保存系统运行的上下文，需要进行地址段的划分。由于栈只能向上增长，因此就会限制住栈存储内容的能力。而堆不同，堆中的对象是可以根据需要动态增长的，因此栈和堆的拆分，使得动态增长成为可能，相应栈中只需记录堆中的一个地址即可。
第四，面向对象就是堆和栈的完美结合。其实，面向对象方式的程序与以前结构化的程序在执行上没有任何区别。但是，面向对象的引入，使得对待问题的思考方式发生了改变，而更接近于自然方式的思考。当我们把对象拆开，你会发现，对象的属性其实就是数据，存放在堆中；而对象的行为（方法），就是运行逻辑，放在栈中。我们在编写对象的时候，其实即编写了数据结构，也编写的处理数据的逻辑。不得不承认，面向对象的设计，确实很美。

递归溢出原因：

递归层次太深。
人为

   #include  
　　int main ( ) 
　　{ 
　　char name[8]; 
　　printf("Please type your name: "); 
　　gets(name); 
　　printf("Hello, %s!", name); 
　　return 0; 
　　}

堆栈溢出
现在我们再执行一次，输入ipxodiAAAAAAAAAAAAAAA,执行完gets(name)之后，由于我们输入的name字符串太长，name数组容纳不下，只好向内存顶部继续写‘A’。由于堆栈的生长方向与内存的生长方向相反，这些‘A’覆盖了堆栈的老的元素。我们可以发现，EBP，ret都已经被‘A’覆盖了。在main返回的时候，就会把‘AAAA’的ASCII码：0x41414141作为返回地址，CPU会试图执行0x41414141处的指令，结果出现错误。这就是一次堆栈溢出。

如何利用堆栈溢出

我们已经制造了一次堆栈溢出。其原理可以概括为：由于字符串处理函数(gets，strcpy等等)没有对数组越界加以监视和限制，我们利用字符数组写越界，覆盖堆栈中的老元素的值，就可以修改返回地址。（更多：http://security.ctocio.com.cn/tips/485/7723985.shtml）。

堆(heap)和栈(stack)有什么区别??

简单的可以理解为：

heap：是由malloc之类函数分配的空间所在地。地址是由低向高增长的。
stack：是自动分配变量，以及函数调用的时候所使用的一些空间。地址是由高向低减少的。
预备知识—程序的内存分配
一个由c/C++编译的程序占用的内存分为以下几个部分

1、栈区（stack）— 由编译器自动分配释放，存放函数的参数值，局部变量的值等。其操作方式类似于数据结构中的栈。

2、堆区（heap） — 一般由程序员分配释放，若程序员不释放，程序结束时可能由OS回收。注意它与数据结构中的堆是两回事，分配方式倒是类似于链表，呵呵。

3、全局区（静态区）（static）—，全局变量和静态变量的存储是放在一块的，初始化的全局变量和静态变量在一块区域，未初始化的全局变量和未初始化的静态变量在相邻的另一块区域。 - 程序结束后有系统释放

4、文字常量区 —常量字符串就是放在这里的。程序结束后由系统释放

5、程序代码区—存放函数体的二进制代码。

二、例子程序

这是一个前辈写的，非常详细

//main.cpp

int a = 0; 全局初始化区

char *p1; 全局未初始化区

main()
{
	int b; 栈
	
	char s[] = "abc"; 栈
	
	char *p2; 栈
	
	char *p3 = "123456"; 123456在常量区，p3在栈上。
	
	static int c =0； 全局（静态）初始化区
	
	p1 = (char *)malloc(10);
	
	p2 = (char *)malloc(20);
	
	分配得来得10和20字节的区域就在堆区。
	
	strcpy(p1, "123456"); 123456放在常量区，编译器可能会将它与p3所指向的"123456"优化成一个地方。
}

二、堆和栈的理论知识

2.1申请方式

stack:

由系统自动分配。例如，声明在函数中一个局部变量 int b; 系统自动在栈中为b开辟空间

heap:

需要程序员自己申请，并指明大小，在c中malloc函数

如p1 = (char *)malloc(10);

在C++中用new运算符

如p2 = (char *)malloc(10);

但是注意p1、p2本身是在栈中的。

2.2申请后系统的响应

栈：只要栈的剩余空间大于所申请空间，系统将为程序提供内存，否则将报异常提示栈溢出。

堆：首先应该知道操作系统有一个记录空闲内存地址的链表，当系统收到程序的申请时，

会遍历该链表，寻找第一个空间大于所申请空间的堆结点，然后将该结点从空闲结点链表中删除，并将该结点的空间分配给程序，另外，对于大多数系统，会在这块内存空间中的首地址处记录本次分配的大小，这样，代码中的delete语句才能正确的释放本内存空间。另外，由于找到的堆结点的大小不一定正好等于申请的大小，系统会自动的将多余的那部分重新放入空闲链表中。

2.3申请大小的限制

栈：在Windows下,栈是向低地址扩展的数据结构，是一块连续的内存的区域。这句话的意思是栈顶的地址和栈的最大容量是系统预先规定好的，在 WINDOWS下，栈的大小是2M（也有的说是1M，总之是一个编译时就确定的常数），如果申请的空间超过栈的剩余空间时，将提示overflow。因此，能从栈获得的空间较小。

堆：堆是向高地址扩展的数据结构，是不连续的内存区域。这是由于系统是用链表来存储的空闲内存地址的，自然是不连续的，而链表的遍历方向是由低地址向高地址。堆的大小受限于计算机系统中有效的虚拟内存。由此可见，堆获得的空间比较灵活，也比较大。

2.4申请效率的比较：

栈由系统自动分配，速度较快。但程序员是无法控制的。

堆是由new分配的内存，一般速度比较慢，而且容易产生内存碎片,不过用起来最方便.

另外，在WINDOWS下，最好的方式是用VirtualAlloc分配内存，他不是在堆，也不是在栈是直接在进程的地址空间中保留一快内存，虽然用起来最不方便。但是速度，也最灵活

2.5堆和栈中的存储内容

栈：在函数调用时，第一个进栈的是主函数中后的下一条指令（函数调用语句的下一条可执行语句）的地址，然后是函数的各个参数，在大多数的C编译器中，参数是由右往左入栈的，然后是函数中的局部变量。注意静态变量是不入栈的。

当本次函数调用结束后，局部变量先出栈，然后是参数，最后栈顶指针指向最开始存的地址，也就是主函数中的下一条指令，程序由该点继续运行。

堆：一般是在堆的头部用一个字节存放堆的大小。堆中的具体内容有程序员安排。

2.6存取效率的比较

char s1[] = “aaaaaaaaaaaaaaa”;

char *s2 = “bbbbbbbbbbbbbbbbb”;

aaaaaaaaaaa是在运行时刻赋值的；

而bbbbbbbbbbb是在编译时就确定的；

但是，在以后的存取中，在栈上的数组比指针所指向的字符串(例如堆)快。

比如：

#include

void main()

{

char a = 1;

char c[] = "1234567890";

char *p ="1234567890";

a = c[1];

a = p[1];

return;

}

对应的汇编代码

10: a = c[1];

00401067 8A 4D F1 mov cl,byte ptr [ebp-0Fh]

0040106A 88 4D FC mov byte ptr [ebp-4],cl

11: a = p[1];

0040106D 8B 55 EC mov edx,dword ptr [ebp-14h]

00401070 8A 42 01 mov al,byte ptr [edx+1]

00401073 88 45 FC mov byte ptr [ebp-4],al

第一种在读取时直接就把字符串中的元素读到寄存器cl中，而第二种则要先把指edx中，在根据edx读取字符，显然慢了。

2.7小结：

堆和栈的区别可以用如下的比喻来看出：

使用栈就象我们去饭馆里吃饭，只管点菜（发出申请）、付钱、和吃（使用），吃饱了就走，不必理会切菜、洗菜等准备工作和洗碗、刷锅等扫尾工作，他的好处是快捷，但是自由度小。

使用堆就象是自己动手做喜欢吃的菜肴，比较麻烦，但是比较符合自己的口味，而且自由度大。

堆和栈的区别主要分：

操作系统方面的堆和栈，如上面说的那些，不多说了。

还有就是数据结构方面的堆和栈，这些都是不同的概念。这里的堆实际上指的就是（满足堆性质的）优先队列的一种数据结构，第1个元素有最高的优先权；栈实际上就是满足先进后出的性质的数学或数据结构。

虽然堆栈，堆栈的说法是连起来叫，但是他们还是有很大区别的，连着叫只是由于历史的原因针值读

hang-7788

关注

2
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录