C/C++语言程序的存储区域



问题提出:

看输出结果,使用c1、c2、c3输出字符串都相同,但c1、c2、c3本身的内容不相同。9620588 1899312看出,完全是两块地方,推断9620588属于常量区,1899312属于栈区。1899324 1899312 1899300这三个数可以看出指针区域为栈区。

#include "stdafx.h"

#include <iostream>

#include <stdio.h>

 

using  namespace std;

 

int _tmain(int argc_TCHARargv[])

{

char *c1 = "abc";

 

char c2[] = "abc";

 

char *c3 =(char*)malloc(3);//c3在栈区,分配得来的3个字节在堆区

 

if (c3 == NULL)

{

printf("Allocate error!");

}

 

c3 = "abc";    // abc\0在常量区,赋值将会把字符串"abc"首地址给c3,改变了c3的地址,如果使用使用free(c3)会报错

 

printf("%d %d %s\n", &c1, c1, c1);

printf("%d %d %s\n", &c2, c2, c2);

printf("%d %d %s\n", &c3, c3, c3);

 

//free(c3);

getchar();

 

return 0;

 

}

运行结果:

 

一、程序的内存分配

C语言代码(文本文件)形成可执行程序(二进制文件),需要经过编译-汇编-链接三个阶段。编译过程把C语言文本文件生成汇编程序,汇编过程把汇编程序形成二进制机器代码,链接过程则将各个源文件生成的二进制机器代码文件组合成一个文件。

 C语言编写的程序经过编译-汇编-链接后,将形成一个统一文件,它由几个部分组成。在程序运行时又会产生其他几个部分,各个部分代表了不同的存储区域:

   1、代码段(Code或Text)

   代码段由程序中执行的机器代码组成。在C语言中,程序语句进行编译后,形成机器代码。在执行程序的过程中,CPU的程序计数器指向代码段的每一条机器代码,并由处理器依次运行。

   2、只读数据段(RO data)

   只读数据段是程序使用的一些不会被更改的数据,使用这些数据的方式类似查表达式的操作,由于这些变量不需要更改,因此只需要放置在只读存储器中即可。

   3、已初始化读写数据段(RW data)

   已初始化数据是在程序中声明,并且具有初值的变量,这些变量需要占用存储器的空间,在程序执行时它们需要位于可读写的内存区域内,并具有初值,以供程序运行时读写。

   4、未初始化数据段(BBS)

   未初始化数据是在程序中声明,但是没有初始化的变量,这些变量在程序运行之前不需要占用存储器的空间。

   5、堆(heap)

   堆内存只在程序运行时出现,一般由程序员分配和释放,在具有操作系统的情况下,如果程序没有释放,操作系统可能在程序(例如一个进程)结束后回收内存。

   6、栈(stack)

     栈内存只在程序运行是出现,在函数内部使用的变量、函数的参数以及返回值将使用栈空间,栈空间由编译器自动分配和释放。

 

实例:

   int a = 0;           //全局初始化区         data段

   static int b = 20;   //全局初始化区         data段

   char *p1;            //全局未初始化区       bss段

   const int A = 10;    //                     ro data段

   

   void main()

   {

   int b;      //栈

   char s[] = "abc";//栈

   char *p2;      //p2

   static int c = 0; //全局(静态)初始化区,data段

   char *p3 = "123456"; //123456\0在常量区,p3在栈上

   p1 = (char*)malloc(10);//分配得来的10和20个字节的区域就在堆区

   p2 = (char*)malloc(20);

   }

二、堆和栈的理论知识

1、申请方式

栈(stack):由系统自动分配。例如,声明在函数中一个局部变量int b;系统自动在栈中为b开辟空间。

堆(heap):需要程序员自己申请,并指明大小,在C中使用malloc函数申请内存。例如:p1=(char*)malloc(10);在C++中用new运算符,如int *p2=new int;但是注意p1、p2本身是在栈中的,而p1、p2所指向的内容在堆中。(malloc和new开辟的内存区,用free和delete释放时,要注意确保释放的内存和分配的内存是同一块内存区,例如:问题提出实例中如果使用free(c3)释放内存会报错。

2、申请后系统的响应

栈:只要栈的剩余空间大于所申请的空间,系统将会为程序提供内存,否则将报异常提示栈溢出。

堆:首先应该知道操作系统有一个记录空闲内存地址的链表,当系统收到程序的申请时,会遍历该链表,寻找第一个空间大雨所申请空间的堆结点,然后将该结点从空闲中的首地址处记录本次分配的大小,这样,代码中的delete(或free)语句才能正确的释放本内存空间。另外,由于找到的堆结点的大小不一定正好等于申请的大小,系统会自动的将多余的那部分重新放入空闲链表中。

3、申请大小的限制

栈:在Windows下,栈是向低地址扩展的数据结构,是一块连续的内存区域。这句话的意思是栈顶的地址和栈的最大容量是系统预先规定好的,在Windows下,栈的大小是2M(也有的说是1M,总之是一个编译时就确定的常数),如果申请的空间超过栈的剩余空间时,将提示overflow。因此,能从栈获得的空间较小。

堆:堆是向高地址扩展的数据结构,是不连续的内存区域。这是由于系统是用链表来存储空闲内存地址的,自然是不连续的,而链表的遍历方向是由低地址向高地址。堆的大小受限于计算机系统中有效的虚拟内存。由此可见,堆获得的空间比较灵活,也比较大。

4、申请效率的比较

栈:由系统自动分配,速度较快,但程序员是无法控制的。

堆:是由new分配的内存,一般速度比较慢,而且容易产生内存碎片,不过用起来最方便。(另外,在Windows下,最好的方式是使用VirtualAlloc分配内存,他不是在堆,也不是在栈,而是直接在进程的地址空间中保留一块内存,虽然用起来最不方便。但是速度最快,也最灵活。)

5、堆和栈中的存储内容

栈:在函数调用时,第一个进栈的是主函数中后的下一条指令(函数调用语句的下一条可执行语句)的地址,然后是函数的各个参数,在大多数的C编译器中,参数是由右往左入栈的,然后是函数中的局部变量。注意静态变量是不入栈的。当本次函数调用结束后,局部变量先出栈,然后是参数,最后栈顶指针指向最开始存的地址,也就是主函数中的下一条指令,程序由该点继续运行。

堆:一般是在堆的头部用一个字节存放堆的大小,堆中的具体内容由程序员安排。

6、存取效率的比较

     char s1[] = "aaaaaaaaaaaaaaa";

 char *s2 = "bbbbbbbbbbbbbbb";

aaaaaaaaaaaaaaa是在运行时刻赋值的,而bbbbbbbbbbbbbbb是在编译时就确定的。但是,在以后的存取中,在栈上的数组比指针所指向的字符串(例如堆)快。

比如:

void main()

{

char a = 1;

char c[] = "1234567890";

char *p = "1234567890";

a = c[1];

a = p[1];

 

return;

}

对应的反汇编代码:

a = c[1];

011F5317  mov         eax,1  

011F531C  shl         eax,0  

011F531F  mov         cl,byte ptr c[eax]  

011F5323  mov         byte ptr [a],cl  

a = p[1];

011F5326  mov         eax,1  

011F532B  shl         eax,0  

011F532E  mov         ecx,dword ptr [p]  

a = p[1];

011F5331  mov         dl,byte ptr [ecx+eax]  

     011F5334  mov         byte ptr [a],dl  

第一种是在读取时直接就把字符串中的元素读到寄存器c1中,而第二种则要先把指针值读到ecx中,再根据ecx读取字符,显然慢了。

 

附:

1、代码段、只读数据段、已初始化读写数据段、未初始化数据段属于静态区域,而堆和栈属于动态区域。

2、代码段、只读数据段和读写数据段将在链接之后产生,未初始化数据段将在程序初始化的时候开辟,而堆和栈将在程序的运行中分配和释放。

3、C语言程序分为映像和运行时两种状态,在编译-汇编-链接后形成的映像中,将只包含代码段(Code 或 Text)、只读数据段(RW Data)和已初始化读写数据段(RO Data)和读写数据段(RW Data)。在程序运行之前,将动态生成未初始化数据段(BSS),在程序的运行时还将动态形成堆(Heap)区域和栈(Stack)区域。一般来说,在静态的映像文件中,各个部分称之为节(Session),而在运行时的各个部分称之为段(Segment)。如果不详细区分,可以统称为段。

4、函数体中定义的变量通常是在栈上,不需要在程序中进行管理,由编译器处理。

用malloc,new等分配内存的函数所分配的内存在堆上,程序必须保证再使用freedelete释放,否则会发生内存泄漏。

5、所有函数体外定义的是全局变量,加了static后的变量不管是在函数内部或外部都放在全局区。

6、使用const定义的变量将放于程序的只读数据区。

7、栈空间主要用于一下3种数据的存储:函数内部的动态变量、函数的参数、函数的返回值。栈空间是动态开辟与回收的,在函数调用过程中,如果函数调用的层次比较多,所需要的栈空间也逐渐加大,对于参数的传递和返回值,如果使用较大的结构体,在使用的栈空间也会比较大。

2015年5月14日

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 虚拟机是一种允许在一个操作系统中运行另一个操作系统的软件,它使用软件模拟硬件的功能。虚拟机有很多种类型和实现方式,其中以基于C/C++语言来设计和实现虚拟机的方式比较常见。 设计和实现C/C++虚拟机的过程可以分为以下几个步骤: 第一步,定义虚拟机的指令集。指令集是虚拟机运行的基本单位,它包含了虚拟机能够执行的基本操作。根据实际需求可以选择一些常用的指令,比如加载、存储、计算等。 第二步,定义虚拟机的内存模型。虚拟机的内存模型包括了堆、栈、全局变量等内存区域以及它们的管理机制。 第三步,实现虚拟机的运行时环境。运行时环境负责管理虚拟机的运行状态,包括指令的解析和执行、内存的分配和回收等。可以使用C/C++编写一个运行时环境库,提供给用户编写的虚拟机程序调用。 第四步,实现虚拟机的编译器。编译器将用户编写的高级语言程序转换为虚拟机指令集形式,这样虚拟机就可以执行用户编写的程序了。编译器的实现可以利用C/C++的编译技术,比如词法分析、语法分析、语义分析等。 第五步,测试和调试。设计和实现虚拟机后,需要进行测试和调试,确保虚拟机的正常运行。 总之,设计和实现C/C++虚拟机需要先定义指令集和内存模型,然后实现虚拟机的运行时环境和编译器,并进行测试和调试,以确保虚拟机的正常运行。这样,用户就可以使用虚拟机来运行各种类型的应用程序了。 ### 回答2: 虚拟机的设计与实现是一个庞大而复杂的任务,需要考虑多个方面,并且要兼顾性能和灵活性。下面我将就这一问题进行回答。 虚拟机的设计首先需要考虑指令集架构的选择。常见的选择有基于栈的架构和基于寄存器的架构。栈架构可以简化指令集的设计和实现,但性能相对较低;而寄存器架构则可以提高性能,但实现较为复杂。根据具体需求和考虑因素,可以选择适合的指令集架构。 在虚拟机的实现中,需要实现指令解码、执行和存储管理等核心功能。指令解码将字节码转化为可执行的机器指令,执行则是根据解码结果执行相应的操作。存储管理包括变量的分配、回收和访问控制等。这些功能需要细致地设计和实现,以保证虚拟机的正确运行和高效性能。 此外,在虚拟机的设计中,还需要考虑辅助功能的实现,如异常处理、线程管理、垃圾回收等。异常处理用于处理运行时错误,线程管理用于支持多线程程序的并发执行,垃圾回收则是通过自动回收不再使用的内存,提高内存利用率。这些功能需要结合具体应用场景和需求进行设计和实现。 最后,虚拟机的性能优化也是设计与实现的重要一环。通过使用一些优化技术,如即时编译、代码缓存、预热等,可以提高虚拟机的执行效率。此外,还可以通过对指令集的扩展和优化,以及对存储管理的优化,进一步提升虚拟机的性能。 总而言之,虚拟机的设计与实现是一个复杂的任务,需要考虑多个方面,包括指令集架构选择、核心功能的实现、辅助功能的实现以及性能优化等。这些方面的设计和实现需要根据具体需求和考虑因素来进行,以保证虚拟机的正确运行和高效性能。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值