堆栈问题
一 前提知识
关于“局部变量、全局变量、堆、堆栈、静态和全局”的知识,详见:http://blog.csdn.net/jamestaosh/archive/2009/09/02/4513188.aspx 或者
http://baike.baidu.com/view/93201.htm
其中引用一段描述如下:
· 栈区(stack)— 由编译器自动分配释放,存放函数的参数值,局部变量的值等。其操作方式类似于数据结构中的栈。
· 堆区(heap) — 一般由程序员分配释放,若程序员不释放,程序结束时可能由OS回收 。注意它与数据结构中的堆是两回事,分配方式倒是类似于链表。
堆和栈的区别
一、预备知识—程序的内存分配
一个由C/C++编译的程序占用的内存分为以下几个部分
1、栈区(stack)— 由编译器自动分配释放 ,存放函数的参数值,局部变量的值等。其操作方式类似于数据结构中的栈。
2、堆区(heap)— 由程序员分配释放, 若程序员不释放,程序结束时可能由OS回收 。注意它与数据结构中的堆是两回事,分配方式倒是类似于链表。
3、全局区(静态区)(static)— 全局变量和静态变量的存储是放在一块的,初始化的全局变量和静态变量在一块区域, 未初始化的全局变量和未初始化的静态变量在相邻的另一块区域。程序结束后由系统释放。
4、文字常量区 — 常量字符串就是放在这里的,程序结束后由系统释放 。
5、程序代码区 — 存放函数体的二进制代码。
二、例子程序
这是一个前辈写的,非常详细
//main.cpp
int a = 0; 全局初始化区
char *p1; 全局未初始化区
main()
{
int b; 栈
char s[] = "abc"; 栈
char *p2; 栈
char *p3 = "123456"; 123456/0在常量区,p3在栈上。
static int c =0; 全局(静态)初始化区
p1 = (char *)malloc(10);
p2 = (char *)malloc(20);
}
分配得来得10和20字节的区域就在堆区。
strcpy(p1, "123456"); 123456/0放在常量区,编译器可能会将它与p3所指向的"123456"优化成一个地方。
关于“栈溢出的原因及解决方法”,详见:
http://blog.sina.com.cn/s/blog_606f9bd70100e51g.html 以及
http://www.shenmeshi.com/Computer/Computer_20091221142225.html
其中引用一段话如下:
void f() { int* p=new int[5]; }
这条短短的一句话就包含了堆与栈,看到new,我们首先就应该想到,我们分配了一块堆内存,那么指针p呢?他分配的是一块栈内存,所以这句话的意思就是:在栈内存中存放了一个指向一块堆内存的指针p。在程序会先确定在堆中分配内存的大小,然后调用operator new分配内存,然后返回这块内存的首地址,放入栈中。
二 GCC压栈
程序在运行时,会在栈中为所有的变量分配地址空间,并不是当运行到某一变量时才把该变量压栈。下面的程序就是想验证程序中所有变量的压栈顺序。
#include <stdio.h>
void f(int i, int j, int k)
{
int m, n;
}
int main(int argc, char* argv)
{
int a;
int b;
f(1, 1, 1);
return 0;
}
程序所涉及的变量地址如下:
类型 | 变量 | 地址 |
int | k | eec54e54 |
int | j | eec54e58 |
int | i | eec54e5c |
int | n | eec54e68 |
int | m | eec54e6c |
char** | argv | eec54e80 |
int | argc | eec54e8c |
int | b | eec54e98 |
int | a | eec54e9c |
由此可见,对于一个函数来说,先将它的局部变量压栈,然后将函数的参数压栈,注意GCC编译器的参数压栈顺序是:由左往右。(另,VC6.0是由右往左)。
三 局部变量在栈,malloc分配的空间在堆
再看下面我自己编写的示例程序,它的功能是:先用一个指针数组存放数据,然后打印出来
#include <stdio.h>
int main(int argc, char *argv[])
{
int *pointers[3]; // 定义了一个 int * 型的指针数组,数组共3个元素,每一个元素指向一个 int 型数据
for (int i=0; i<3; i++)
{
int temp = i;
pointers[i] = &temp;
}
for (int i=0; i<3; i++)
{
printf("%d/n",*pointers[i]);
}
return 0;
}
它的输出结果是:
2
2
2
#include <stdio.h>
#include <stdlib.h> // malloc()
int main(int argc, char *argv[])
{
int *pointers[3];
for (int i=0; i<3; i++)
{
int *pTemp = (int *)malloc(sizeof(int));
*pTemp = i;
pointers[i] = pTemp;
}
for (int i=0; i<3; i++)
{
printf("%d/n",*pointers[i]);
}
return 0;
}
红色加粗标记的代码部分是与第一个程序不同的地方。它的输出结果是:
0
1
2
首先我们必须明确的是:程序中所有变量在运行之前都会申请到具体的地址空间,比如全局变量,会在静态存储去申请到地址;
这两段程序的唯一区别在于:
1. 第一个程序第一个for循环中定义的是局部变量temp,如下图所示。temp的值会保存在栈中[A-4, A]的地址上,经过三次循环后,pointers[0]、pointers[1]和pointers[2]都会指向地址[A-4, A],然而最后一次循环将temp的值赋为2,即[A-4, A]上存放的数据为2,所以打印的结果就都是2;
2. 第二个程序的第一个for循环中定义的pTemp虽然保存在栈中,但是pTemp实际指向的却是堆的地址,如下图所示。每一次循环,都会在堆里分配大小为32字节的空间,指针pTemp会指向该地址,然后由于pointers[i]=pTemp,所以每次pointers[i],都会指向新的地址,所以不存在最终结果覆盖的问题,所以结果为:0 1 2。
补充说明1 链表插入问题
往链表中插入一个元素时应该注意:
当往链表中某一指定节点前插入一个元素时,必须获得该指定节点的前一个节点,即,假设链表为:AàBàC,往C之前插入D的话,必须要获得C的指针,然后:
D->next = B->next; (or D->next = C;)
B->next = D
补充说明2 函数参数的计算顺序和压栈无关
设int arr[]={6,7,8,9,10};
int *ptr=arr;
*(ptr++)+=123;
printf("%d,%d",*ptr,*(++ptr));
答案为什么是:8,8
以上这个问题和函数的压栈顺序无关,只和函数对参数的计算顺序有关系。
在printf() 函数中,先计算的是*(++ptr),后计算的是*ptr。