Linux内存分配小结--malloc、brk、mmap

最新推荐文章于 2024-02-15 11:41:05 发布

JerrySing

最新推荐文章于 2024-02-15 11:41:05 发布

阅读量859

点赞数 1

分类专栏： Linux相关

Linux相关专栏收录该内容

1 篇文章 0 订阅

订阅专栏

Linux的虚拟内存管理有几个关键概念：

1、每个进程都有独立的虚拟地址空间，进程访问的虚拟地址并不是真正的物理地址；

2、虚拟地址可通过每个进程上的页表（在每个进程的内核虚拟空间地址）与物理地址进行映射，获得真正的物理地址；

3、如果虚拟地址对应物理地址不在物理内存中，则产生缺页中断，真正分配物理地址，同时更新进程的页表如果此时物理内存已耗尽，则根据内存替换算法淘汰部分页面至物理磁盘中。

基于以上认识，进行了如下分析：

一、Linux虚拟地址空间如何分布？

Linux使用虚拟地址空间，大大增加了进程的寻址空间，由低地址到高地址分别为：

1、只读段： 该部分空间只能读，不可写；（包括：代码段、rodata段（C常量字符串和#define定义的常量））

2、数据段：保存全局变量和静态变量的空间；

3、堆：就是平时所说的动态内存，malloc和new大部分都源于此。其中堆顶的位置可通过函数brk和sbrk进行动态调整；

4、文件映射区域：如动态库、共享内存等映射物理空间的内存，一般是mmap函数所分配的虚拟地址空间；

5、栈：用于维护函数调用的上下文空间，一般为8M，可通过ulimit -s查看

6、内核虚拟空间：用户代码不可见的内存区域，由内核管理（页表就存放在内核虚拟空间）。

下面是32位系统典型的虚拟地址空间分布（来自《深入理解计算机系统》）

32位系统有4G的地址空间

其中0x08048000~0xbfffffff 是用户空间空间， 0xc00000000~0xffffffff是内核空间，包括内核代码和数据、与进程相关的数据结构（如页表、内核栈）等。另外，%esp执行栈顶，往低地址方向变化；brk/sbrk函数控制堆顶_edata往高地址方向变化

64位系统结果怎样呢？64位系统是否拥有2^64的地址空间吗？

事实上，64位系统的虚拟地址空间划分发生了改变：

1、地址空间大小不是2^32，也不是2^64，而一般是2^48。因为并不需要2^64这么大的寻址空间，过大的寻址空间只会导致资源的浪费。64位Linux一般使用48位来表示虚拟地址空间，40位表示物理地址，这可通过/proc/cpuinfo来查看

2、其中，0x0000000000000000~0x00007fffffffffff 表示用户空间，0xFFFF800000000000~ 0xFFFFFFFFFFFFFFFF 表示内核空间，共提供 256TB(2^48) 的寻址空间。这两个区间的特点是，第47位与48~63位相同，若这些位为0表示用户空间，否则表示内核空间。

3、用户空间由低地址到高地址仍然是只读段、数据段、堆、文件映射区域和栈；

二、malloc

如何查看进程发生缺页中断的次数？

用ps -o majflt, minflt -C program命令查看。

majflt 代表major fault，中文名叫大错误， minflt代表minor fault ，中文名叫小错误。

这两个数值表示一个进程自启动以来所发生的缺页中断的次数。

发生缺页中断后，执行了那些操作？

当一个进程发生缺页中断的时候，进程会陷入内核态，执行以下操作：

1. 检查要访问的虚拟地址是否合法

2. 查找/分配一个物理页

3. 填充物理页内容（读取磁盘，或者直接置0，或者啥也不干）

4. 建立映射关系（虚拟地址到物理地址）

重新执行发生缺页中断的那条指令

如果第三步，需要读取磁盘，那么这次缺页中断就是majflt，否则就是minflt。

内存分配的原理

从操作系统角度来看，进程分配内存有两种方式，分别由两个系统调用完成：brk和mmap（不考虑共享内存）

1. brk是将数据段（.data）的最高地址指针_edata往高地址上推；

2. mmap是在进程的虚拟地址空间中，（堆和栈中间，称为文件映射区域的地方）找一块空闲的虚拟内存。

这两种分配方式都是虚拟内存，没有分配物理内存。在第一次访问已分配的虚拟地址空间的时候，发生缺页中断，操作系统负责分配物理内存，然后建立虚拟内存和物理内存之间的映射关系。

在标准的C库中，提供了malloc/free函数分配释放内存，这两个函数底层是由brk，mmap，munmap这些系统调用实现的。

下面以一个例子来说明内存分配的原理：

情况一、malloc小于128k的内存，使用brk分配内存，将_edata往高地址推（只分配虚拟空间，不对应物理内存（因此没有初始化），第一次读/写数据时，引起内核缺页中断，内核才分配对应的物理内存，然后虚拟地址空间建立映射关系），如下图：

1、进程启动的时候，其（虚拟）内存空间的初始布局如图1所示。

其中，mmap内存映射文件是在堆和栈的中间（例如libc-2.2.93.so，其他数据文件等），为了简单起见，省略了内存映射文件。

_edata指针（glibc里面定义）指向数据段的最高地址。

2、进程调用A = malloc(30K)以后，内存空间如图2：

malloc函数会调用brk系统调用，将_edata指针往高地址推30K，就完成虚拟内存的分配。

你可能会问：只要把_edata+30K就完成内存分配了？

事实是这样的，_edata+30K只是完成虚拟内存地址的分配，A这块内存现在还是没有物理页与之对应的，等到进程第一次读写A这块内存的时候，发生缺页中断，这个时候，内核才分配A这块内存对应的物理页。也就是说，如果用malloc分配了A这块内存，然而从来不访问它，那么A对应的物理页是不会被分配的。

3、进程调用B = malloc(40K)以后，内存空间如图3。

情况二、 malloc大于128的内存，使用mmap分配内存，在堆和栈之间找一块空闲内存分配（对应独立内存，而且初始化为0），如下图：

4、进程调用C= malloc(200K)以后，内存空间如图4：

默认情况下，malloc函数分配内存，如果请求内存大于128K（可由M_MMAP_THRESHOLD选项调节），那就不是去推_edata指针了，而是利用mmap系统调用，从堆和栈的中间分配一块虚拟内存。

这样子做主要是因为：

brk分配的内存需要等到高地址内存释放以后才能释放（例如，在B释放之前，A是不可能释放的，这就是内存碎片产生的原因，什么时候紧缩看下面），而mmap分配内存可以单独释放。

5、进程调用D= malloc（100K）以后，内存空间如图5；

6、进程调用free(C)以后，C对应的虚拟内存和物理内存一起释放。

7、进程调用free(B)以后，如图7所示：

B对应的虚拟内存和物理内存都没有释放，因为只有一个_edata指针，如果往回推，那么D这块内存怎么办呢？当然，B这块内存，是可以重用的，如果这个时候再来一个40K的请求，那么malloc很可能就把B这块内存返回回去了。

8、进程调用free(D)以后，如图8所示：

B和D连接起来，变成一块140K的空闲内存。

9、默认情况下：

当最高地址空间的空闲内存超过128K（可由M_TRIM_THRESHOLD选项调节）时，执行内地紧缩操作（trim）。在上一个步骤free的时候，发现最高地址空闲内存超过128K，于是内存紧缩，变成图9所示。

三、既然堆内内存brk和sbrk不能直接释放，为什么不全部使用mmap来分配，munmap直接释放呢？

既然堆内碎片不能直接释放，导致疑似内存泄露问题，为什么malloc不全部使用mmap来实现呢（mmap分配的内存可以通过munmap进行free，实现真正的释放）？而仅仅对大于128K的大块内存才使用mmap？

其实，进程向OS申请和释放地址空间的接口sbrk/mmap/munmap 都是系统调用，频繁调用系统调用都比较消耗系统资源。并且，mmap申请的内存被munmap后，重新申请会产生更多的缺页中断。缺页中断是内核行为，会导致内核态CPU消耗较大。另外如果使用mmap分配小内存，会导致地址空间的分片更多，内核的管理负担更大。

同时堆是一个连续空间，并且堆内碎片由于没有归还OS，如果可重用碎片，再次访问该内存很可能不需产生任何系统调用和缺页中断，这将大大降低CPU的消耗。因此，glibc的malloc实现中，充分考虑了sbrk和mmap行为上的差异及优缺点，默认分配大块内存（128K）才使用mmap获得地址空间，也可通过mallopt（M_MMAP_THRESHOLD, <SIZE>）来修改这个临界值。

四、如何查看进程的缺页中断信息？

可通过以下命令查看缺页中断信息

ps -o majflt,minflt -C <program_name>

ps -o majflt,minflt -p <pid>

其中:: majflt 代表major fault，指大错误

minflt代表minor fault，指小错误

这两个数值表示一个进程自启动以来所发生的缺页中断的次数。

其中majflt与minflt的不同是：

majflt表示需要读写磁盘，可能是内存对应页面在磁盘中需要load到物理内存中，也可能是此时物理内存不足，需要淘汰部分物理页面到磁盘中。

五、 C语言的内存分配方式与malloc

C语言跟内存分配方式

（1）从静态存储区分配。内存在程序编译的时候就已经分配好，这块内存在程序的整个运行期间内都存在。例如全局变量和静态变量。

（2）在栈上创建。在执行函数时，函数内局部变量的存储单元都可以在栈上创建，函数执行结束时，这些存储单元自动释放。栈内存分配运算内置于处理器的指令集中，效率很高，但是分配的内存容量有限。

（3）从堆上分配，亦称为动态内存分配。程序在运行的时候用malloc和new申请任意多少的内存，程序员自己负责何时free或delete释放内存。动态内存的生存期由我们决定，使用非常灵活，但问题也最多。

C语言跟内存申请相关的函数主要有alloc，calloc，malloc，free，realloc，sbrk等。其中alloc是向栈申请内存，因此无需释放。malloc分配的内存是位于堆中的，并且没有初始化内存的内容，调用函数memset来初始化这部分的内存空间。calloc则将初始化这部分内存，设置为0。而realloc则对malloc申请的内存进行大小的调整。申请的内存最终需要通过函数free来释放。而sbrk则是增加数据段的大小；

malloc/calloc/free 基本上都是C函数库实现的，跟OS无关。C函数库内部通过一定的结构来保存当前有多少可用内存。如果程序malloc的大小超出了库里所留存的空间，那么将首先调用brk系统调用来增加可用空间，然后再分配空间.free时，释放的内存并不立即返回给os，而是保留在内部结构中。打嗝比方：brk类似于批发，一次性的向os申请大的内存，而malloc等函数则类似于零售，满足程序运行时的要求，这套机制类似于缓冲。

使用这套机制的原因：系统调用不能支持任意大小的内存分配（有的系统调用只支持固定大小以及其倍数的内存申请，这样的话，对于小内存的分配会造成浪费；系统调用申请内存代价昂贵，涉及到用户态和核心态的转换）

函数malloc()和calloc() 都可以用来分配动态内存空间，但两者稍有区别。

在Linux系统上，程序被载入内存时，内核为用户进程地址建立了代码段、数据段和堆栈段，在数据段和堆栈段之间的空闲区域用于动态内存分配。

内核数据结构mm_struct中的成员变量start_code 和end_code是进程代码段的起始和终止地址，start_data 和end_data是进程数据段的起始和终止地址，start_stack是进程堆栈段起始地址，start_brk是进程动态内存分配起始地址，还有一个brk，就是动态内存分配当前的终止地址。

C语言的动态内存分配的基本函数是malloc，在Linux上的基本实现是通过内核brk系统调用。brk()是一个非常简单的系统调用，只是简单改变mm_struct结构的成员变量brk的值

mmap系统调用实现了更有用的动态内存分配功能，可以将一个磁盘文件的全部或部分内容映射到用户空间中，进程读写文件的操作变成了读写内存的操作。在linux/mm/mmap.c文件的do_mmap_pgoff()函数，是mmap系统调用实现的核心。do_mmap_pgoff()的代码，只是新建了一个vm_area_struct结构，并把file结构的参数赋值给其他成员变量m_file，并没有把文件内容实际装入内存。

Linux内存管理的基本思想之一，是只有在真正访问一个地址的时候才建立这个地址的物理映射。

JerrySing

关注

1
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
Linux内存分配小结--malloc、brk、mmap

Linux的虚拟内存管理有几个关键概念：1、每个进程都有独立的虚拟地址空间，进程访问的虚拟地址并不是真正的物理地址；2、虚拟地址可通过每个进程上的页表（在每个进程的内核虚拟空间地址）与物理地址进行映射，获得真正的物理地址；3、如果虚拟地址对应物理地址不在物理内存中，则产生缺页中断，真正分配物理地址，同时更新进程的页表如果此时物理内存已耗尽，则根据内存替换算法淘汰部分页面至物理磁盘中。...
复制链接

扫一扫