C++内存分配
1 内存分配方式
在C++中,内存分成5个区,他们分别是堆、栈、自由存储区、全局/静态存储区和常量存储区。
栈区(stack):由编译器自动分配释放,栈区一般存放局部变量、函数参数值等。栈内存大小是有限制的,不能超过栈的大小,否则会造成栈的溢出。
void func()
{
int Number[1024]={0}; //Number数组从栈上分配内存
}
Windows
在应用层的栈大小为1M,而Linux
在应用层的大小为10M。这就意味着在Windows
的应用层分配的栈空间大小不能超过1M,Linux
栈上分配的栈空间不能超过10M。栈上分配的内存,系统会在函数运行结束的时候自动回收。
堆区(heap):存放动态分配的数据,比如由new
分配的内存块,一般一个new
就要对应一个delete
。一般由程序员分配释放, 若程序员不释放,程序结束时可能由OS
回收 。
void func()
{
int* p=new int[5]; //在堆上new了一块内存,分配的大小为5个int类型,返回这块内存首地址给栈上存储的指针p,因此这一句代码既包括了堆也包括了栈。
delete p;
p = nullptr;
}
自由存储区:就是那些由malloc
等分配的内存块,他和堆是十分相似的,不过它是用 free
来结束自己的生命的。
全局/静态存储区:全局变量和静态变量的存储是放在同一个内存块,初始化的全局变量和静态变量在一块区域data
段, 未初始化的全局变量和未初始化的静态变量在相邻的另一块区域bss
段,程序结束后有系统释放。
//比如定义了一个全局变量
int g_iNumber[1024]={0}; //g_iNumber就是在全局/静态区获取内存
常量存储区:这是一块比较特殊的存储区,他们里面存放的是常量,不允许修改(当然,你要通过非正当手段也可以修改,而且方法很多)
2 堆和栈的区别
-
管理方式上
栈:是由编译器自动管理,无需我们手动控制
堆:释放工作是由程序员控制,如果忘记释放会产生内存泄漏 -
空间大小上
堆:在32位系统上,堆内存可以达到4G的空间,从这个角度来看堆内存几乎是没有什么限制的。操作系统有一个记录空闲内存地址的链表,当系统收到程序的申请时,会遍历该链表,寻找第一个空间大于所申请空间的堆结点,然后将该结点从空闲结点链表中删除,并将该结点的空间分配给程序。另外,对于大多数系统,会在这块内存空间中的首地址处记录本次分配的大小,这样代码中的delete
语句才能正确的释放本内存空间。另外,由于找到的堆结点的大小不一定正好等于申请的大小,系统会自动的将多余的那部分重新放入空闲链表中
栈:在32位系统上,一般都是有一定的空间大小的,比如在VC6上,默认的栈空间大小是1M。只要栈的剩余空间大于所申请空间,系统将为程序提供内存,否则将报异常提示栈溢出 -
碎片问题上
堆:频繁的new
和delete
会造成内存空间不连续,从而造成大量的碎片,使程序效率降低
栈:则不会存在这个问题,因为栈使先进后出队列,不可能有一个内存块从栈中间弹出 -
生长方向上
堆:生长方向是向上的,即向着内存地址增加的方向,因此堆是由高地址扩展的数据结构,是不连续的内存区域
栈:生长方向是向下的,即向着内存地址减小的方向增长,因此栈是由低地址扩展的数据结构,是连续的内存区域。栈顶的地址和栈的最大容量是系统预先规定好的 -
分配方式上
堆:堆是动态分配的,没有静态分配的堆。堆的动态分配是由new
函数分配,由程序员释放
栈:栈有两种分配方式,即静态分配和动态分配。栈的静态分配是由编译器完成的,栈的动态分配是由malloc
函数分配,由编译器释放 -
分配效率上
栈:栈是系统系统的数据结构,计算机会在底层对栈提供支持,即分配专门的寄存器存放栈的地址,压栈出栈都有专门的指令执行,这就决定栈的效率比较高
堆:堆则是在C++
函数库提供的,机制是比较复杂的,例如为了分配一块内存,库函数会按照一定的算法在堆内存中搜索可用的足够大小的空间,如果没有足够大小的空间(可能由于内存碎片太多),就有可能调用系统功能去增加程序数据段的内存空间,这样就有机会分到足够大小的内存,然后进行返回。因此,堆的效率比栈要低很多。
从这里我们可以看到,堆和栈相比,由于大量 new/delete
的使用,容易造成大量的内存碎片;由于没有专门的系统支持,效率很低;由于可能引发用户态和核心态的切换,内存的申请,代价变得更加昂贵。所以栈在程序中是应用最广泛的,就算是函数的调用也利用栈去完成,函数调用过程中的参数,返回地址,EBP 和局部变量都采用栈的方式存放。所以,我们推荐大家尽量用栈,而不是用堆。
虽然栈有如此众多的好处,但是由于和堆相比不是那么灵活,有时候分配大量的内存空间,还是用堆好一些。
无论是堆还是栈,都要防止越界现象的发生(除非你是故意使其越界),因为越界的结果要么是程序崩溃,要么是摧毁程序的堆、栈结构,产生以想不到的结果,就算是在你的程序运行过程中,没有发生上面的问题,你还是要小心,说不定什么时候就崩掉,那时候 debug
可是相当困难的。
3 尽量少使用全局变量
全局变量存放在全局/静态存储区,在整个程序期间都有效,程序所有函数也都可以访问。
尽量少使用全局变量,原因有二:
①全局变量有可能会造成名字冲突,即在一个复杂的项目中,各个模块由不同的程序员开发,互相不知道对方是否用了同样的全局变量,因此会造成名字冲突。
②全局变量存在多线程安全问题,对全局变量的修改和访问需要做多线程安全考虑。因此,一个程序里不能有太多的全局变量。
一般数据会存在栈、堆和全局/静态区,应尽可能的减少全局变量的使用。