Windows堆和栈的比较

最新推荐文章于 2022-09-01 19:20:12 发布

Zenhobby

最新推荐文章于 2022-09-01 19:20:12 发布

阅读量1.6k

点赞数

分类专栏： C++ 操作系统

C++ 同时被 2 个专栏收录

64 篇文章 5 订阅

订阅专栏

操作系统

13 篇文章 0 订阅

订阅专栏

一、预备知识程序的内存分配

一个由c/C++编译的程序占用的内存分为以下几个部分

1、 栈区（stack） 由编译器自动分配释放，存放函数的参数值，局部变量的值等。其操作方式类似于数据结构中的栈。

2、 堆区（heap） 一般由程序员分配释放，若程序员不释放，程序结束时可能由OS回收。注意它与数据结构中的堆是两回事，分配方式倒是类似于链表，呵呵。

3、 全局区（静态区）（static） 全局变量和静态变量的存储是放在一块的，初始化的全局变量和静态变量在一块区域，未初始化的全局变量和未初始化的静态变量在相邻的另一块区域。 - 程序结束后有系统释放

4、 文字常量区 常量字符串就是放在这里的。程序结束后由系统释放

5、 程序代码区 存放函数体的二进制代码。

二、例子程序

//main.cpp 
int a = 0; 全局初始化区 
char *p1; 全局未初始化区 
main() 
{ 
    int b;                    //栈 
    char s[] = "abc";         //栈 
    char *p2;                 //栈 
    char *p3 = "123456";      //123456\0在常量区，p3在栈上。 
    static int c =0；         //全局（静态）初始化区 
    p1 = (char *)malloc(10); 
    p2 = (char *)malloc(20);  //分配得来得10和20字节的区域就在堆区。 
    strcpy(p1, "123456");     //123456\0放在常量区，编译器可能会将它与p3所指向的"123456"优化成一个地方。 
}

二、堆和栈的理论知识

2.1申请方式

stack:

由系统自动分配。例如，声明在函数中一个局部变量 int b; 系统自动在栈中为b开辟空间

heap:

需要程序员自己申请，并指明大小，在c中malloc函数

如p1 = (char *)malloc(10);

在C++中用new运算符

如p2 = (char *)malloc(10);

但是注意 p1、p2本身是在栈中的。

2.2 申请后系统的响应

栈：只要 栈的剩余空间大于所申请空间，系统将为程序 提供内存，否则将报异常提示栈溢出。

堆：首先应该知道操作系统有一个 记录空闲内存地址的链表，当系统收到程序的申请时，会 遍历该链表，寻找 第一个空间大于所申请空间的堆结点，然后将该结点从空闲结点链表中删除，并将该结点的空间分配给程序，另外，对于大多数系统，会在这块 内存空间中的首地址处记录本次分配的大小，这样，代码中的 delete语句才能正确的释放本内存空间。另外，由于找到的堆结点的大小不一定正好等于申请的大小，系统会自动的将多余的那部分重新放入空闲链表中。

2.3申请大小的限制

栈：在Windows下, 栈是向低地址扩展的数据结构，是一块连续的内存的区域。这句话的意思是栈顶的地址和栈的最大容量是系统预先规定好的，在WINDOWS下，栈的大小是2M（也有的说是1M，总之是一个编译时就确定的常数），如果申请的空间超过栈的剩余空间时，将提示overflow。因此，能从栈获得的空间较小。

堆：堆是向高地址扩展的数据结构，是不连续的内存区域。这是由于系统是用链表来存储的空闲内存地址的，自然是不连续的，而链表的遍历方向是由低地址向高地址。堆的大小受限于计算机系统中有效的虚拟内存。由此可见，堆获得的空间比较灵活，也比较大。

2.4申请效率的比较：

栈由系统自动分配，速度较快。但程序员是无法控制的。

堆是由 new分配的内存，一般速度比较慢，而且容易产生内存碎片,不过用起来最方便.

另外，在WINDOWS下，最好的方式是用 VirtualAlloc分配内存，他不是在堆，也不是在栈，是 直接在进程的地址空间中保留一快内存，虽然用起来最不方便。但是速度快，也最灵活。

2.5堆和栈中的存储内容

栈：在函数调用时，第一个进栈的是主函数中后的下一条指令（函数调用语句的下一条可执行语句）的地址，然后是函数的各个参数，在大多数的C编译器中，参数是由 右往左入栈的，然后是函数中的 局部变量。注意 静态变量是不入栈的。

当本次函数调用结束后， 局部变量先出栈，然后是参数，最后栈顶指针指向 最开始存的地址，也就是主函数中的下一条指令，程序由该点继续运行。

堆：一般是在堆的头部 用一个字节存放堆的大小。堆中的具体内容有程序员安排。

2.6存取效率的比较

char s1[] = "aaaaaaaaaaaaaaa"; 
char *s2 = "bbbbbbbbbbbbbbbbb";

aaaaaaaaaaa是在 运行时刻赋值的；

而bbbbbbbbbbb是在 编译时就确定的；

但是，在以后的存取中，在 栈上的数组比指针所指向的字符串(例如堆)快。

s2 指针变量本身在栈上， 指向的内容在静态存储区；

s1只是个 数组名， 本身不占运行时程序的空间，只是在源程序中 用来标记一个字符数组（即其首地址），而 数组也是存储在栈上的。

char * c="hello world";把c隐式转换为const char*指针了，仅仅让 c指向字符串，保存字符串的地址，char c[]="hello world"会为 C开辟空间然后把hello word复制进去

char c1[]="hello world"；
char c2[]="hello world"；

c1和c2是 开辟的两个不同的空间，彼此地址不同， 分别把hello world 复制进去

char * c1="hello world";
char * c2="hello world";

时 c1和c2的值相同，都存的是 hello world 这个字符串常量的首地址

#include 
void main() 
{ 
    char a = 1; 
    char c[] = "1234567890"; 
    char *p ="1234567890"; 
    a = c[1]; 
    a = p[1]; 
    return; 
}

第一种在读取时直接就把字符串中的元素读到寄存器cl中，而第二种则要先把指针值读到edx中，在根据edx读取字符，显然慢了。

2.7 指针作为返回值时的问题

不要用return语句返回直向"栈内存"的指针,因为该内存在函数结束时自动消亡.

char *GetString(void)
{
   char p[] = "hello world";
   return p; //编译器将提出警告
}

但如果指针指向的是堆上的地址，那么分配一个地址作为返回值的话，是可取的

float *search(float (*pointer)[4],int n)
{
   float *pt;
   pt = *(pointer+n);
   return(pt);   
}

第二种情况下，指针返回的是一个业已存在的地址，对其修改会导致所有指向该地址的指针变量的数据变化，如果只是想要修改该数据的一个副本，则应该使用

float *pt = new float[100];

或者

float *pt = (float*)malloc(100*sizeof(float));

拷贝数据副本作为变量进行使用。

来源： <http://bbs.csdn.net/topics/20048693>

2.8小结：

1.碎片问题：对于堆来讲，频繁的 new/delete势必会造成 内存空间的不连续，从而造成大量的碎片，使程序效率降低。对于栈来讲，则不会存在这个问题，因为 栈是先进后出的队列，他们是如此的一一对应，以至于 永远都不可能有一个内存块从栈中间弹出，在他弹出之前，在他上面的后进的栈内容已经被弹出，详细的可以参考数据结构，这里我们就不再一一讨论了。

2.生长方向：对于堆来讲， 生长方向是向上的，也就是 向着内存地址增加的方向；对于栈来讲，它的生长方向是向下的，是 向着内存地址减小的方向增长。

3.分配方式：堆都是动态分配的，没有静态分配的堆。栈有2种分配方式： 静态分配和动态分配。静态分配是编译器完成的，比如 局部变量的分配。动态分配由 alloca函数进行分配，但是栈的动态分配和堆是不同的，他的动态分配是由编译器进行释放，无需我们手工实现。

4.分配效率：栈是机器系统提供的数据结构，计算机会在底层对栈提供支持：分配专门的寄存器存放栈的地址，压栈出栈都有专门的指令执行，这就决定了栈的效率比较高。堆则是C/C++函数库提供的，它的机制是很复杂的，例如为了分配一块内存，库函数会按照一定的算法（具体的算法可以参考数据结构/操作系统）在堆内存中搜索可用的足够大小的空间，如果没有足够大小的空间（可能是由于内存碎片太多），就有可能 调用系统功能去增加程序数据段的内存空间，这样就有机会分到足够大小的内存，然后进行返回。显然，堆的效率比栈要低得多。