[转]C/C++中的堆栈问题_win c++ ex.what()没有堆栈信息-CSDN博客

本文链接：https://blog.csdn.net/u014353474/article/details/32710919

本文是在百度文库拣的，进行了整理。

堆栈的问题困惑了好久，APUE第二版的第七章第六节（C程序的存储空间布局也对该部分进行了讲解，但是APUE中没有提到字符串常量的问题，个人感觉本文的解释比较合理，下表即时APUE中的一个表），本文讲述的更草根一些。

高地址	命令行参数和环境变量
	栈区（向下）
	……
	堆区（向上）
	全局区（包括未初始化的数据区，和初始化的数据区）
低地址	正文，即代码区

零、预备知识―程序的内存分配

一个由C/C++编译的程序占用的内存分为以下几个部分：

1、栈区（stack）—— 由编译器自动分配释放，存放函数的参数值，局部变量的值等。自动变量以及每次函数调用时所需保存的信息都放在此段中。每次调用函数时，其返回地址以及调用者的环境信息都存放在栈中。然后，最近被调用的函数在栈上为其自动和临时变量分配存储空间。通过以这种方式使用栈，可以递归调用C函数。递归函数每次调用自身时，就使用一个新的栈帧，因此一个函数调用实例中的变量集不会影响另一个函数调用实例中的变量。其操作方式类似于数据结构中的栈。

2、堆区（heap） —— 通常在堆中进行动态存储分配。也就是由程序员进行申请和释放，申请成功，如果在使用完毕之后程序结束以前，没有进行释放，就会造成内存泄露，很严重。注意它与数据结构中的堆是两回事，分配方式倒是类似于链表。堆位于非初始化数据段和栈之间。

3、全局区（静态区）（static）——包括非初始化的数据区（由exec初始化为0或空指针）和初始化的数据区。全局变量和静态变量的存储是放在一块的，初始化的全局变量和静态变量在一块区域，未初始化的全局变量和未初始化的静态变量在相邻的另一块区域。程序结束后由系统释放。

4、文字常量区 ——常量字符串就是放在这里的。程序结束后由系统释放。

5、程序代码区（正文段）——这是由CPU执行的机器指令部分。该部分是共享的，只读的（防止程序由于意外而修改其自身的指令。）

一、示例

这是一个前辈写的，非常详细

//main.c
int a = 0; 全局初始化区
char *p1; 全局未初始化区，初始化为空指针
int main()
{
	int b; 栈
	char s[] ="abc"; 栈，长度为4的数组。
	char *p2; 栈
	char *p3 ="123456"; 123456\0在常量区，p3在栈上。
	static int c =0； 全局（静态）初始化区
	p1 = (char*)malloc(10);
	p2 = (char*)malloc(20);
分配得来得10和20字节的区域就在堆区。
	strcpy(p1,"123456"); 123456\0放在常量区，编译器可能会将它与p3所指向的"123456"优化成一个地方。
}

二、堆和栈的理论知识

2.1申请方式

stack:由系统自动分配。例如，声明在函数中一个局部变量int b; 系统自动在栈中为b开辟空间

heap:需要程序员自己申请，并指明大小，在c中malloc函数

如p1 = (char *)malloc(10);

在C++中用new运算符

如p2 = (char *)malloc(10);

但是注意p1、p2本身是在栈中的。

2.2申请后系统的响应

栈：只要栈的剩余空间大于所申请空间，系统将为程序提供内存，否则将报异常提示栈溢出。( Segmentation fault)

堆：首先应该知道操作系统有一个记录空闲内存地址的链表，当系统收到程序的申请时，会遍历该链表，寻找第一个空间大于所申请空间的堆结点，然后将该结点从空闲结点链表中删除，并将该结点的空间分配给程序，另外，对于大多数系统，会在这块内存空间中的首地址处记录本次分配的大小，这样，代码中的delete语句才能正确的释放本内存空间。另外，由于找到的堆结点的大小不一定正好等于申请的大小，系统会自动的将多余的那部分重新放入空闲链表中。

2.3申请大小的限制

栈：在Windows下,栈是向低地址扩展的数据结构，是一块连续的内存的区域。这句话的意思是栈顶的地址和栈的最大容量是系统预先规定好的，在WINDOWS下，栈的大小是2M（也有的说是1M，总之是一个编译时就确定的常数），如果申请的空间超过栈的剩余空间时，将提示overflow。因此，能从栈获得的空间较小。

堆：堆是向高地址扩展的数据结构，是不连续的内存区域。这是由于系统是用链表来存储的空闲内存地址的，自然是不连续的，而链表的遍历方向是由低地址向高地址。堆的大小受限于计算机系统中有效的虚拟内存。由此可见，堆获得的空间比较灵活，也比较大。

2.4申请效率的比较：

栈由系统自动分配，速度较快。但程序员是无法控制的。

堆是由new分配的内存，一般速度比较慢，而且容易产生内存碎片,不过用起来最方便.

另外，在WINDOWS下，最好的方式是用VirtualAlloc分配内存，他不是在堆，也不是在栈是直接在进程的地址空间中保留一快内存，虽然用起来最不方便。但是速度快，也最灵活。

2.5堆和栈中的存储内容

栈：在函数调用时，第一个进栈的是主函数中后的下一条指令（函数调用语句的下一条可执行语句）的地址，然后是函数的各个参数，在大多数的C编译器中，参数是由右往左入栈的，然后是函数中的局部变量。注意静态变量是不入栈的。

当本次函数调用结束后，局部变量先出栈，然后是参数，最后栈顶指针指向最开始存的地址，也就是主函数中的下一条指令，程序由该点继续运行。

堆：一般是在堆的头部用一个字节存放堆的大小。堆中的具体内容有程序员安排。

2.6存取效率的比较

char s1[] ="aaaaaaaaaaaaaaa";

char *s2 ="bbbbbbbbbbbbbbbbb";

aaaaaaaaaaa是在运行时刻赋值的；

而bbbbbbbbbbb是在编译时就确定的；

但是，在以后的存取中，在栈上的数组比指针所指向的字符串(例如堆)快。

比如：

#include<string.h>
int main()
{
<span style="white-space:pre">	</span>char a = 1;
<span style="white-space:pre">	</span>char c[] ="1234567890";
<span style="white-space:pre">	</span>char *p="1234567890";
<span style="white-space:pre">	</span>a = c[1];
<span style="white-space:pre">	</span>a = p[1];
<span style="white-space:pre">	</span>return 0;
}

对应的汇编代码

7: a = c[1];

00401067 8A 4D F1 movcl,byte ptr [ebp-0Fh]

0040106A 88 4D FC movbyte ptr [ebp-4],cl

8: a = p[1];

0040106D 8B 55 EC movedx,dword ptr [ebp-14h]

00401070 8A 42 01 moval,byte ptr [edx+1]

00401073 88 45 FC movbyte ptr [ebp-4],al

第一种在读取时直接就把字符串中的元素读到寄存器cl中，而第二种则要先把指针值读到edx中，在根据edx读取字符，显然慢了。