C++学习笔记(二)——程序在内存中分配方式
C++程序的不同元素在内存中分配的位置不同会影响这些元素的访问权限、生命周期以及访问地址。只有理解了C++程序在内存中分配方式才能够编写出更加优质的程序,理解有关内存的出错信息。本文的讲解核心就是通过程序示例理解《深入理解计算机系统(原书第三版)》的第13的图1-13(进程的虚拟地址空间),之后再对该图做些深入的扩展。
进程的虚拟地址空间
如下图所示(此图源于《深入理解计算机系统(原书第三版)》的第13页的图1-13(进程的虚拟地址空间)):
虚拟内存时一个抽象概念,它为每个进程提供了一个假象,即每个进程都在独占地使用主存。每个进程看到地内存都是一致地,称为虚拟地址空间。上图所示的是Linux进程虚拟地址空间。在Linux中,地址空间最上面的区域是保留给操作系统中的代码和数据的,这对所有进程来说都是一样的。地址空间的底部区域存放用户进程定义的代码和数据。请注意图中的地址是从下往上增大的。
每个进程看到的阿虚拟地址空间由大量准确定义的区构成,每个区都有专门的功能。现从最低地址开始简单介绍一下(更深入的了解请参考《深入理解计算机系统(原书第三版)》的后续章节):
- 程序代码和数据。对所有的进程来说,代码是从同意固定地址开始,紧接着的是和C++全局变量相对应的数据位置。代码和数据区是直接按照可执行目标文件的内容初始化的。《深入理解计算机系统(原书第三版)》的第7章有更为详细的内容。
- 堆。代码和数据区后紧随着的是运行时堆。代码和数据区在进程一开始运行时就被指定了大小,故在运行时其大小不可变。与此不同,当调用像malloc/free和new/delete这样的C标准库函数和C++表达式时,堆可以在运行时动态地扩展和收缩。《深入理解计算机系统(原书第三版)》的第9章有更加详细地介绍。
- 共享库。大约在地址空间地中间部分是一块用来存放像C/C++标准库和数学库这样的共享库的代码和数据的区域。共享库的概念非常强大,也相当难懂。《深入理解计算机系统(原书第三版)》的第7章介绍动态链接时,将学习共享库是如今二工作的。
- 栈。位于用户虚拟地址空间的顶部的是用户栈,编译器用它来实现函数调用。和堆一样,用户栈在程序执行期间可以动态地扩展和收缩。特别地,每次我们调用一个函数时,栈就会增减;从一个函数返回时,栈就会收缩。《深入理解计算机系统(原书第三版)》的第3章中将学习编译器是如何使用栈地。
- 内核虚拟内存。地址空间顶部地区域是为内核保留地。不允许应用程序读写这个区域的内容或者直接调用内核代码定义的函数。相反,他们必须调用内核来执行这些操作。
以上摘抄自《深入理解计算机系统(原书第三版)》的第13页的部分内容,其中我稍有改写。
利用示例程序验证与完成进程的虚拟地址空间示意图
如上所说,想要彻底搞懂进程在虚拟空间上的分配还是需要下相当大的功夫的。目前我的目标就是验证栈、堆、书写数据和只读的数据与代码的相对存放位置以及存放在这些位置的数据的一些读写特性。
///
/// @file memory.cc
/// @date 2019-02-05 22:18:38
///
#include <stdio.h>
#include <string.h>
#include <iostream>
using std::cout;
using std::endl;
int a = 0;//a为全局变量
char *p1;//p1为全局变量
int main()
{
int b;//b为局部变量
char s[] = "123456";//s为局部变量
char * p2;//局部变量
const char * p3 = "12345";//p3为局部变量,p3不可以改变指针所指地址的内容,而可以改变所指的地址
//"12345"位于文字常量区,不能
//进行修改,只能读取,所以,不添加const关键字,下面有对
//其值进行修改时编译会有警告,但程序运行会出现core错误。
//
static int c = 0;//c为局部常量
p1 = new char[10];//p1为堆变量
p2 = new char[5];//p2为堆变量
strcpy(p1, "123456");
printf("&12345= %p\n", "12345");
printf("&a = %p\n", &a);
printf("&p1 = %p\n", &p1);
printf("p1 = %p\n", p1);
printf("&b = %p\n", &b);
printf("&s = %p\n", s);
printf("&p2 = %p\n", p2);
printf("&p3 = %p\n", &p3);
printf("p3 = %p\n", p3);
printf("&c = %p\n", &c);
return 0;
}
运行结果如下图所示:
依据打印的结果画出这些变量的相对位置如下图:
栈是用来存放局部变量的,堆是用来存放通过malloc/free或new/delete申请到的空间的变量。读写区是用来存放全局变量以及通过static关键字创建的局部变量。只读区用来存放常量的(被const关键字所限定的非指针变量也存放在只读区,有一个问题:const修饰的指针被存放在读写区,那他的功能(如指针常量的功能是指向的地址内容不可以改变但是指向的地址可以改变)是怎么实现的?答:指针常量本身存放在读写区,即可以改变指向,而它所指的地址却在只读区,即指向的地址的内容不可变(我个人猜测)。)。这四个区由于生命周期不同,所以其内的变量存在时间也各不相同。==所以,在编写代码时一定要考虑到变量的存在时间与哪个区匹配,再声明为相应的变量类型。==目前,我只能够确定栈的生命周期与该进程是一致的。栈、堆、读写区、只读区的生命周期必须要搞明白然后补充到这里。
给我的启发以及日后相关工作的安排
我在研一的时候曾花费了我大量的时间去阅读!《深入理解计算机系统(原书第三版)》,还在书上做了不少的笔记。但是这本书太厚了,以至于我越读越懵,而且,读完之后并没有感觉到自己的代码能力提升了。==现在在写这篇文章时我似乎发现了一条阅读这部书的主线——进程在虚拟内存中的分配——如果依据这个主线,去检索式的阅读该书或许有所收获。==带着下面的问题去阅读概述:
- 栈:何时(如何)被创建,如何使用栈,何时(如何)被销毁;
- 堆:何时(如何)被创建,如何使用堆,何时(如何)被销毁;
- 读写区:何时(如何)被创建,如何使用读写区,何时(如何)被销毁;
- 只读数据与代码区:何时(如何)被创建,如何使用,何时(如何)被销毁;
- 进程在虚拟内存的其他部分也会有相同的问题的;