堆和栈是一个统称,可以有很多的实现方式。计算机程序通常有一个栈叫做调用栈,用来存储当前函数调用相关的信息(比如:主调函数的地址,局部变量),因为函数调用之后需要返回给主调函数。栈通过扩展和收缩来承载信息。实际上,程序不是由运行时来控制的,它由编程语言、操作系统甚至是系统架构来决定。堆是在任何内存中动态和随机分配的(内存的)统称;也就是无序的。内存通常由操作系统分配,通过应用程序调用 API 接口去实现分配。在管理动态分配内存上会有一些额外的开销,不过这由操作系统来处理。
它们的大小由什么决定?
依赖于语言,编译器,操作系统和架构。栈通常提前分配好了,因为栈必须是连续的内存块。语言的编译器或者操作系统决定它的大小。不要在栈上存储大块数据,这样可以保证有足够的空间不会溢出,除非出现了无限递归的情况(额,栈溢出了)或者其它不常见了编程决议。
堆是任何可以动态分配的内存的统称。它的大小是变动的。在现代处理器中和操作系统的工作方式是高度抽象的,因此你在正常情况下不需要担心它实际的大小.
- 在多线程环境下每一个线程都可以有他自己完全的独立的栈,但是他们共享堆。并行存取被堆控制而不是栈。
- 堆包含一个链表来维护已用和空闲的内存块。在堆上新分配(用 new 或者 malloc)内存是从空闲的内存块中找到一些满足要求的合适块。这个操作会更新堆中的块链表。这些元信息也存储在堆上,经常在每个块的头部一个很小区域。
- 堆的增加新块通常从地地址向高地址扩展。因此你可以认为堆随着内存分配而不断的增加大小。如果申请的内存大小很小的话,通常从底层操作系统中得到比申请大小要多的内存。
- 申请和释放许多小的块可能会产生如下状态:在已用块之间存在很多小的空闲块。进而申请大块内存失败,虽然空闲块的总和足够,但是空闲的小块是零散的,不能满足申请的大小,。这叫做“堆碎片”。
- 当旁边有空闲块的已用块被释放时,新的空闲块可能会与相邻的空闲块合并为一个大的空闲块,这样可以有效的减少“堆碎片”的产生。
哪个更快一些?
栈更快因为所有的空闲内存都是连续的,因此不需要对空闲内存块通过列表来维护。只是一个简单的指向当前栈顶的指针。编译器通常用一个专门的、快速的寄存器来实现。更重要的一点事是,随后的栈上操作通常集中在一个内存块的附近,这样的话有利于处理器的高速访问(译者注:局部性原理)。
Stack:
栈是为执行线程留出的内存空间。当函数被调用的时候,栈顶为局部变量和一些 bookkeeping 数据预留块。当函数执行完毕,块就没有用了,可能在下次的函数调用的时候再被使用。栈通常用后进先出(LIFO)的方式预留空间;因此最近的保留块(reserved block)通常最先被释放。这么做可以使跟踪堆栈变的简单;从栈中释放块(free block)只不过是指针的偏移而已。
- Stored in computer RAM just like the heap. 就像堆一样存储在计算机RAM中。
- Variables created on the stack will go out of scope and automatically deallocate.在栈上创建变量的时候会扩展,并且会自动回收。
- Much faster to allocate in comparison to variables on the heap. 相比堆而言在栈上分配要快的多。
- Implemented with an actual stack data structure. 用数据结构中的栈实现。
- Stores local data, return addresses, used for parameter passing 存储局部数据,返回地址,用做参数传递。
- Can have a stack overflow when too much of the stack is used. (mostly from infinite (or too much) recursion, very large allocations) 当用栈过多时可导致栈溢出(无穷次(大量的)的递归调用,或者大量的内存分配)。
- Data created on the stack can be used without pointers.在栈上的数据可以直接访问(不是非要使用指针访问)。
- You would use the stack if you know exactly how much data you need to allocate before compile time and it is not too big.如果你在编译之前精确的知道你需要分配数据的大小并且不是太大的时候,可以使用栈。
- Usually has a maximum size already determined when your program starts 当你程序启动时栈的容量上限是固定的。
Heap:
堆(heap)是为动态分配预留的内存空间。和栈不一样,从堆上分配和重新分配块没有固定模式;你可以在任何时候分配和释放它。这样使得跟踪哪部分堆已经被分配和被释放变的异常复杂;有许多定制的堆分配策略(eg: 内存管理技术-减少cookie(bookkeeping)-减少malloc调用)用来为不同的使用模式下调整堆的性能。
- Stored in computer RAM just like the stack. 和栈一样存储在计算机RAM。
- In C, variables on the heap must be destroyed manually and never fall out of scope. The data is freed with delete, delete[], or free 在C中,堆上的变量必须要手动释放,不存在作用域的问题。数据可用 delete, delete[] 或者 free 来释放。
- Slower to allocate in comparison to variables on the stack. 相比在栈上分配内存要慢。
- Used on demand to allocate a block of data for use by the program. 通过程序按需分配。
- Can have fragmentation when there are a lot of allocations and deallocations 频繁的分配和释放可造成内存碎片。
- In C++ data created on the heap will be pointed to by pointers and allocated with new or malloc 在 C++ 中,在堆上创建数的据使用指针访问,用 new 或者 malloc 分配内存。
- Can have allocation failures if too big of a buffer is requested to be allocated. 如果申请的缓冲区过大的话,可能申请失败。
- You would use the heap if you don't know exactly how much data you will need at runtime or if you need to allocate a lot of data. 在运行期间你不知道会需要多大的数据或者你需要分配大量的内存的时候,建议你使用堆。
- Responsible for memory leaks 可能造成内存泄露。
每一个线程都有一个栈,但是每一个应用程序通常都只有一个堆(尽管为不同类型分配内存使用多个堆的情况也是有的。
1. 当线程创建的时候,操作系统(OS)为每一个系统级(system-level)的线程分配栈。通常情况下,操作系统通过调用语言的运行时 (runtime) 去为应用程序分配堆。
2. 栈附属于线程,因此当线程结束时栈被回收。堆通常通过运行时在应用程序启动时被分配,当应用程序(进程)退出时被回收。
3. 当线程被创建的时候,设置栈的大小。在应用程序启动的时候,设置堆的大小,但是可以在需要的时候扩展(分配器向操作系统申请更多的内存)。
4. 栈比堆要快,因为它存取模式使它可以轻松的分配和重新分配内存(指针/整型只是进行简单的递增或者递减运算),然而堆在分配和释放的时候有更多的复杂的 bookkeeping 参与。另外,在栈上的每个字节频繁的被复用也就意味着它可能映射到处理器缓存中,所以很快(译者注:局部性原理)。
局部性原理: CPU访问存储器时,无论是存取指令还是存取数据,所访问的存储单元都趋于聚集在一个较小的连续区域中。
时间局部性(Temporal Locality):如果一个信息项正在被访问,那么在近期它很可能还会被再次访问。程序循环、堆栈等是产生时间局部性的原因。
空间局部性(Spatial Locality):在最近的将来将用到的信息很可能与正在使用的信息在空间地址上是临近的。
顺序局部性(Order Locality):在典型程序中,除转移类指令外,大部分指令是顺序进行的。顺序执行和非顺序执行的比例大致是5:1。此外,对大型数组访问也是顺序的。指令的顺序执行、数组的连续存放等是产生顺序局部性的原因。