C语言 -- 存储区域

最新推荐文章于 2024-02-15 15:51:33 发布

weixin_33804990

最新推荐文章于 2024-02-15 15:51:33 发布

阅读量153

点赞数

文章标签：数据结构与算法 c/c++ 操作系统

原文链接：https://my.oschina.net/u/239287/blog/69270

版权

2019独角兽企业重金招聘Python工程师标准>>>

C程序 -- 存储区域[一]
由C语言代码（文本文件）形成可执行程序（二进制文件），需要经过编译-汇编-连接三个阶段。编译过程把C语言文本文件生成汇编程序，汇编过程把汇编程序形成二进制机器代码，连接过程则将各个源文件生成的二进制机器代码文件组合成一个文件。C语言编写的程序经过编译-连接后，将形成一个统一文件，它由几个部分组成。在程序运行时又会产生其他几个部分，各个部分代表了不同的存储区域：
1.代码段（Code或Text）
代码段由程序中执行的机器代码组成。在C语言中，程序语句进行编译后，形成机器代码。在执行程序的过程中，CPU的程序计数器指向代码段的每一条机器代码，并由处理器依次运行。
2.只读数据段（RO data）
只读数据段是程序使用的一些不会被更改的数据，使用这些数据的方式类似查表式的操作，由于这些变量不需要更改，因此只需要放置在只读存储器中即可。
3.已初始化读写数据段（RW data）
已初始化数据是在程序中声明，并且具有初值的变量，这些变量需要占用存储器的空间，在程序执行时它们需要位于可读写的内存区域内，并具有初值，以供程序运行时读写。
4.未初始化读写数据段（BSS）
未初始化数据是在程序中声明，但是没有初始化的变量，这些变量在程序运行之前不需要占用存储器的空间。
5.堆（heap）
堆内存只在程序运行时出现，一般由程序员分配和释放。在具有操作系统的情况下，如果程序没有释放，操作系统可能在程序（例如一个进程）结束后回收内存。
6.栈（stack）
栈内存只在程序运行时出现，在函数内部使用的变量、函数的参数以及返回值将使用栈空间，栈空间由编译器自动分配和释放。
示例：

　 int a = 0;                     //全局初始化区。已初始化读写数据段（RW data）
    static int b=20;                //全局初始化区。已初始化读写数据段（RW data）
    char *p1;                        //全局未初始化区，未初始化数据段（BSS）
    const int A = 10;              //只读数据段（RO data）
    void main（ void ）
    {
    int b;                          //栈
    char s[] = "abc" ;              //栈
    char *p2;                       //栈
    static int c = 0;               //全局（静态）初始化区 .data段
    char *p3 = "123456" ;           //123456\0在常量区，p3在栈上。
    p1 = （ char *） malloc （10）；//分配得来的10和20个字节的区域就在堆区
    p2 = （ char *） malloc （20）；
    strcpy （p1, "123456" ）；      //123456\0 在常量区，编译器可能会将它与p3所指向的"123456"优化成一个地方
    }

　　代码段、只读数据段、读写数据段、未初始化数据段属于静态区域，而堆和栈属于动态区域。代码段、只读数据段和读写数据段将在链接之后产生，未初始化数据段将在程序
初始化的时候开辟，而堆和栈将在程序的运行中分配和释放。C语言程序分为映像和运行时两种状态。在编译-连接后形成的映像中，将只包含代码段（Text）、只读数据段（RO Data）和读写数据段（RW Data）。在程序运行之前，将动态生成未初始化数据段（BSS），在程序的运行时还将动态形成堆（Heap）区域和栈（Stack）区域。一般来说，在静态的映像文件中，各个部分称之为节（Section），而在运行时的各个部分称之为段（Segment）。如果不详细区分，可以统称为段。

变量使用注意：
1.函数体中定义的变量通常是在栈上，不需要在程序中进行管理，由编绎器处理。
2.用malloc,calloc,realloc等分配内存的函数所分配的内存空间在堆上，程序必须保证在使用free释放，否则会发生内存泄漏。
3.所有函数体外定义的是全局变量，加了static后的变量不管是在函数内部或外部都放在全局区。
4.使用const定义的变量将放于程序的只读数据区。

栈空间主要用于以下3种数据的存储：
1.函数内部的动态变量
2.函数的参数
3.函数的返回值

栈空间是动态开辟与回收的。在函数调用过程中，如果函数调用的层次比较多，所需要的栈空间也逐渐加大，对于参数的传递和返回值，如果使用较大的结构体，在使用的栈空间也会比较大。

---------------------------------------------------------------------------------------------------------------
C程序 -- 存储区域[二]
1. 栈－－由编译器自动分配释放
2. 堆－－通常由程序员分配释放，若程序员不释放，程序结束时可能由OS回收
3. 全局区（静态区）－－全局变量和静态变量的存储是放在一块的，初始化的全局变量和静态变量在一块区域，未初始化的全局变量和未初始化的静态变量在相邻的另一块区域。程序结束释放。
4. 常量区－－专门放常量的地方，程序结束释放。

在函数体中定义的变量通常是在栈上，用malloc, calloc, realloc等分配内存的函数分配得到的就是在堆上。在所有函数体外定义的是全局量，加了static修饰符后不管在哪里都存放在全局区（静态区）,在所有函数体外定义的static变量表示在该文件中有效，不能extern到别的文件用，在函数体内定义的static表示只在该函数体内有效。另外，函数中的"helloworld"这样的字符串存放在常量区。
比如：
代码:
int a = 0; //全局初始化区
char *p1; //全局未初始化区
main()
{
int b; //栈
char s[] = "abc"; //栈
char *p2; //栈
char *p3 = "123456"; //123456在常量区，p3在栈上。
static int c = 0； //全局（静态）初始化区
p1 = (char *)malloc(10);
p2 = (char *)malloc(20);
//分配得来得10和20字节的区域就在堆区。
strcpy(p1, "123456");
//123456放在常量区，编译器可能会将它与p3所指向的"123456"优化成一块。
还有就是函数调用时会在栈上有一系列的保留现场及传递参数的操作。
栈的空间大小有限定，vc的缺省是2M。栈不够用的情况一般是程序中分配了大量数组和递归函数层次太深。有一点必须知道，当一个函数调用完返回后它会释放该函数中所有的栈空间。栈是由编译器自动管理的。
堆是动态分配内存的，并且你可以分配使用很大的内存。但是用不好会产生内存泄漏。并且频繁地malloc和free会产生内存碎片（有点类似磁盘碎片），因为c分配动态内存时是寻找匹配的内存的。而用栈则不会产生碎片。
在栈上存取数据比通过指针在堆上存取数据快些。
一般大家说的堆栈和栈是一样的，就是栈(stack)，而说堆时才是堆heap. 栈是先入后出的，一般是由高地址向低地址生长。堆(heap)和栈(stack)是C/C++编程不可避免会碰到的两个基本概念。首先，这两个概念都可以在讲数据结构的书中找到，他们都是基本的数据结构，虽然栈更为简单一些。
在具体的C/C++编程框架中，这两个概念并不是并行的。对底层机器代码的研究可以揭示，栈是机器系统提供的数据结构，而堆则是C/C++函数库提供的。
具体地说，现代计算机(串行执行机制)，都直接在代码底层支持栈的数据结构。这体现在，有专门的寄存器指向栈所在的地址，有专门的机器指令完成数据入栈出栈的操作。
机制的特点是效率高，支持的数据有限，一般是整数，指针，浮点数等系统直接支持的数据类型，并不直接支持其他的数据结构。因为栈的这种特点，对栈的使用在程序中是非常频繁的。对子程序的调用就是直接利用栈完成的。机器的call指令里隐含了把返回地址推入栈，然后跳转至子程序地址的操作，而子程序中的ret指令则隐含从堆栈中弹出返回地址并跳转之的操作。C/C++中的自动变量是直接利用栈的例子，这也就是为什么当函数返回时，该函数的自动变量自动失效的原因。和栈不同，堆的数据结构并不是由系统(无论是机器系统还是操作系统)支持的，而是由函数库提供的。基本的malloc/realloc/free函数维护了一套内部的堆数据结构。当程序使用这些函数去获得新的内存空间时，这套函数首先试图从内部堆中寻找可用的内存空间，如果没有可以使用的内存空间，则试图利用系统调用来动态增加程序数据段的内存大小，新分配得到的空间首先被组织进内部堆中去，然后再以适当的形式返回给调用者。当程序释放分配的内存空间时，这片内存空间被返回内部堆结构中，可能会被适当的处理(比如和其他空闲空间合并成更大的空闲空间)，以更适合下一次内存分配申请。这套复杂的分配机制实际上相当于一个内存分配的缓冲池(Cache)，使用这套机制有如下若干原因：

1. 系统调用可能不支持任意大小的内存分配。有些系统的系统调用只支持固定大小及其倍数的内存请求(按页分配)；这样的话对于大量的小内存分类来说会造成浪费。
2. 系统调用申请内存可能是代价昂贵的。系统调用可能涉及用户态和核心态的转换。
3. 没有管理的内存分配在大量复杂内存的分配释放操作下很容易造成内存碎片。

堆和栈的对比
从以上知识可知，栈是系统提供的功能，特点是快速高效，缺点是有限制，数据不灵活；而堆是函数库提供的功能，特点是灵活方便，数据适应面广泛，但是效率有一定降低。栈是系统数据结构，对于进程/线程是唯一的；堆是函数库内部数据结构，不一定唯一。不同堆分配的内存无法互相操作。
栈空间分静态分配和动态分配两种。静态分配是编译器完成的，比如自动变量(auto)的分配。动态分配由malloca函数完成。栈的动态分配无需释放(是自动的)，也就没有释放函数。为可移植的程序起见，栈的动态分配操作是不被鼓励的！堆空间的分配总是动态的，虽然程序结束时所有的数据空间都会被释放回系统，但是精确的申请内存/释放内存匹配是良
好程序的基本要素。

C程序 -- 存储区域[三]

一个由c/C++编译的程序占用的内存分为以下几个部分

1、栈区（stack）— 程序运行时由编译器自动分配，存放函数的参数值，局部变量的值等。其操作方式类似于数据结构中的栈。程

序结束时由编译器自动释放。

2、堆区（heap） — 在内存开辟另一块存储区域。一般由程序员分配释放，若程序员不释放，程序结束时可能由OS回收。注意它

与数据结构中的堆是两回事，分配方式倒是类似于链表，呵呵。

3、全局区（静态区）（static）—编译器编译时即分配内存。全局变量和静态变量的存储是放在一块的，初始化的全局变量和静态

变量在一块区域，未初始化的全局变量和未初始化的静态变量在相邻的另一块区域。 - 程序结束后由系统释放

4、文字常量区 —常量字符串就是放在这里的。程序结束后由系统释放

5、程序代码区—存放函数体的二进制代码。

例子程序

这是一个前辈写的，非常详细

//main.cpp

int a = 0; 全局初始化区

char *p1; 全局未初始化区

main()

{

int b;// 栈

char s[] = "abc"; //栈

char *p2; //栈

char *p3 = "123456"; //"123456\0"在常量区，p3在栈上。

static int c =0； //全局（静态）初始化区

p1 = (char *)malloc(10);

p2 = (char *)malloc(20);

//分配得来得10和20字节的区域就在堆区。

strcpy(p1, "123456"); //123456\0放在常量区，编译器可能会将它与p3所指向的"123456"优化成一个地方。

}

===============

C语言程序的内存分配方式

1.内存分配方式
　　内存分配方式有三种：
　　[1]从静态存储区域分配。内存在程序编译的时候就已经分配好，这块内存在程序的整个运行期间都存在。例如全局变量，

static变量。
　　[2]在栈上创建。在执行函数时，函数内局部变量的存储单元都可以在栈上创建，函数执行结束时这些存储单元自动被释放。栈

内存分配运算内置于处理器的指令集中，效率很高，但是分配的内存容量有限。
　　[3]从堆上分配，亦称动态内存分配。程序在运行的时候用malloc或new申请任意多少的内存，程序员自己负责在何时用free或

delete释放内存。动态内存的生存期由程序员决定，使用非常灵活，但如果在堆上分配了空间，就有责任回收它，否则运行的程序会

出现内存泄漏，频繁地分配和释放不同大小的堆空间将会产生堆内碎块。
2.程序的内存空间
　　一个程序将操作系统分配给其运行的内存块分为4个区域，如下图所示。
　　一个由C/C++编译的程序占用的内存分为以下几个部分,
　　1、栈区（stack）—　由编译器自动分配释放，存放为运行函数而分配的局部变量、函数参数、返回数据、返回地址等。其操

作方式类似于数据结构中的栈。
　　2、堆区（heap） —　一般由程序员分配释放，若程序员不释放，程序结束时可能由OS回收。分配方式类似于链表。
　　3、全局区（静态区）（static）—存放全局变量、静态数据、常量。程序结束后由系统释放。
　　4、文字常量区 —常量字符串就是放在这里的。程序结束后由系统释放。
　　5、程序代码区—存放函数体（类成员函数和全局函数）的二进制代码。
　　下面给出例子程序，
　　int a = 0; //全局初始化区
　　char *p1; //全局未初始化区
　　int main() {
　　int b; //栈
　　char s[] = "abc"; //栈
　　char *p2; //栈
　　char *p3 = "123456"; //123456在常量区，p3在栈上。
　　static int c =0;//全局（静态）初始化区
　　p1 = new char[10];
　　p2 = new char[20];
　　//分配得来得和字节的区域就在堆区。
　　strcpy(p1, "123456"); //123456放在常量区，编译器可能会将它与p3所指向的"123456"优化成一个地方。
　　}
3．堆与栈的比较
　　3.1申请方式
　　stack: 由系统自动分配。例如，声明在函数中一个局部变量 int b; 系统自动在栈中为b开辟空间。
　　heap: 需要程序员自己申请，并指明大小，在C中malloc函数，C++中是new运算符。
　　如p1 = (char *)malloc(10); p1 = new char[10];
　　如p2 = (char *)malloc(10); p2 = new char[20];
　　但是注意p1、p2本身是在栈中的。
　　3.2申请后系统的响应
　　栈：只要栈的剩余空间大于所申请空间，系统将为程序提供内存，否则将报异常提示栈溢出。
　　堆：首先应该知道操作系统有一个记录空闲内存地址的链表，当系统收到程序的申请时，会遍历该链表，寻找第一个空间大于所

申请空间的堆结点，然后将该结点从空闲结点链表中删除，并将该结点的空间分配给程序。
　　对于大多数系统，会在这块内存空间中的首地址处记录本次分配的大小，这样，代码中的delete语句才能正确的释放本内存空间

。
　　由于找到的堆结点的大小不一定正好等于申请的大小，系统会自动的将多余的那部分重新放入空闲链表中。
　　3.3申请大小的限制
　　栈：在Windows下,栈是向低地址扩展的数据结构，是一块连续的内存的区域。这句话的意思是栈顶的地址和栈的最大容量是系统

预先规定好的，在 WINDOWS下，栈的大小是2M（也有的说是1M，总之是一个编译时就确定的常数），如果申请的空间超过栈的剩余空

间时，将提示overflow。因此，能从栈获得的空间较小。
　　堆：堆是向高地址扩展的数据结构，是不连续的内存区域。这是由于系统是用链表来存储的空闲内存地址的，自然是不连续的，

而链表的遍历方向是由低地址向高地址。堆的大小受限于计算机系统中有效的虚拟内存。由此可见，堆获得的空间比较灵活，也比较

大。
　　3.4申请效率的比较
　　栈由系统自动分配，速度较快。但程序员是无法控制的。
　　堆是由new分配的内存，一般速度比较慢，而且容易产生内存碎片,不过用起来最方便。
　　另外，在WINDOWS下，最好的方式是用VirtualAlloc分配内存，他不是在堆，也不是栈，而是直接在进程的地址空间中保留一快

内存，虽然用起来最不方便。但是速度快，也最灵活。
　　3.5堆和栈中的存储内容
　　栈：在函数调用时，第一个进栈的是主函数中后的下一条指令（函数调用语句的下一条可执行语句）的地址，然后是函数的各个

参数，在大多数的C编译器中，参数是由右往左入栈的，然后是函数中的局部变量。注意静态变量是不入栈的。
　　当本次函数调用结束后，局部变量先出栈，然后是参数，最后栈顶指针指向最开始存的地址，也就是主函数中的下一条指令，程

序由该点继续运行。
　　堆：一般是在堆的头部用一个字节存放堆的大小。堆中的具体内容有程序员安排。
　　3.6存取效率的比较
　　char s1[] = "a";
　　char *s2 = "b";
　　a是在运行时刻赋值的；而b是在编译时就确定的；但是，在以后的存取中，在栈上的数组比指针所指向的字符串(例如堆)快。

比如：
　　int　main(){
　　char a = 1;
　　char c[] = "1234567890";
　　char *p ="1234567890";
　　a = c[1];
　　a = p[1];
　　return 0;
　　}
　　对应的汇编代码
　　10: a = c[1];
　　00401067 8A 4D F1 mov cl,byte ptr [ebp-0Fh]
　　0040106A 88 4D FC mov byte ptr [ebp-4],cl
　　11: a = p[1];
　　0040106D 8B 55 EC mov edx,dword ptr [ebp-14h]
　　00401070 8A 42 01 mov al,byte ptr [edx+1]
　　00401073 88 45 FC mov byte ptr [ebp-4],al
　　第一种在读取时直接就把字符串中的元素读到寄存器cl中，而第二种则要先把指针值读到edx中，再根据edx读取字符，显然慢了

。

3.7小结
　　堆和栈的主要区别由以下几点：
　　1、管理方式不同；
　　2、空间大小不同；
　　3、能否产生碎片不同；
　　4、生长方向不同；
　　5、分配方式不同；
　　6、分配效率不同；
　　管理方式：对于栈来讲，是由编译器自动管理，无需我们手工控制；对于堆来说，释放工作由程序员控制，容易产生memory

leak。
　　空间大小：一般来讲在32位系统下，堆内存可以达到4G的空间，从这个角度来看堆内存几乎是没有什么限制的。但是对于栈来讲

，一般都是有一定的空间大小的，例如，在VC6下面，默认的栈空间大小是1M。当然，这个值可以修改。
　　碎片问题：对于堆来讲，频繁的new/delete势必会造成内存空间的不连续，从而造成大量的碎片，使程序效率降低。对于栈来讲

，则不会存在这个问题，因为栈是先进后出的队列，他们是如此的一一对应，以至于永远都不可能有一个内存块从栈中间弹出，在他

弹出之前，在他上面的后进的栈内容已经被弹出，详细的可以参考数据结构。
　　生长方向：对于堆来讲，生长方向是向上的，也就是向着内存地址增加的方向；对于栈来讲，它的生长方向是向下的，是向着内

存地址减小的方向增长。
　　分配方式：堆都是动态分配的，没有静态分配的堆。栈有2种分配方式：静态分配和动态分配。静态分配是编译器完成的，比如

局部变量的分配。动态分配由malloca函数进行分配，但是栈的动态分配和堆是不同的，他的动态分配是由编译器进行释放，无需我

们手工实现。
　　分配效率：栈是机器系统提供的数据结构，计算机会在底层对栈提供支持：分配专门的寄存器存放栈的地址，压栈出栈都有专门

的指令执行，这就决定了栈的效率比较高。堆则是C/C++函数库提供的，它的机制是很复杂的，例如为了分配一块内存，库函数会按

照一定的算法（具体的算法可以参考数据结构/操作系统）在堆内存中搜索可用的足够大小的空间，如果没有足够大小的空间（可能

是由于内存碎片太多），就有可能调用系统功能去增加程序数据段的内存空间，这样就有机会分到足够大小的内存，然后进行返回

。显然，堆的效率比栈要低得多。
　　从这里我们可以看到，堆和栈相比，由于大量new/delete的使用，容易造成大量的内存碎片；由于没有专门的系统支持，效率很

低；由于可能引发用户态和核心态的切换，内存的申请，代价变得更加昂贵。所以栈在程序中是应用最广泛的，就算是函数的调用也

利用栈去完成，函数调用过程中的参数，返回地址， EBP和局部变量都采用栈的方式存放。所以，我们推荐大家尽量用栈，而不是用

堆。
　　虽然栈有如此众多的好处，但是由于和堆相比不是那么灵活，有时候分配大量的内存空间，还是用堆好一些。
　　无论是堆还是栈，都要防止越界现象的发生（除非你是故意使其越界），因为越界的结果要么是程序崩溃，要么是摧毁程序的堆

、栈结构，产生以想不到的结果。
4.new/delete与malloc/free比较
　　从C++角度上说，使用new分配堆空间可以调用类的构造函数，而malloc()函数仅仅是一个函数调用，它不会调用构造函数，它所

接受的参数是一个unsigned long类型。同样，delete在释放堆空间之前会调用析构函数，而free函数则不会。
　　class Time{
　　public:
　　Time(int,int,int,string);
　　~Time(){
　　cout<<"call Time’s destructor by:"<<name<<endl;
　　}
　　private:
　　int hour;
　　int min;
　　int sec;
　　string name;
　　};
　　Time::Time(int h,int m,int s,string n){
　　hour=h;
　　min=m;
　　sec=s;
　　name=n;
　　cout<<"call Time’s constructor by:"<<name<<endl;
　　}
　　int main(){
　　Time *t1;
　　t1=(Time*)malloc(sizeof(Time));
　　free(t1);
　　Time *t2;
　　t2=new Time(0,0,0,"t2");
　　delete t2;
　　system("PAUSE");
　　return EXIT_SUCCESS;
　　}
　　结果：
　　call Time’s constructor by:t2
　　call Time’s destructor by:t2
　　从结果可以看出，使用new/delete可以调用对象的构造函数与析构函数，并且示例中调用的是一个非默认构造函数。但在堆上分

配对象数组时，只能调用默认构造函数，不能调用其他任何构造函数。