Glibc 的malloc源代码分析

最新推荐文章于 2022-06-25 10:49:23 发布

terrytan18

最新推荐文章于 2022-06-25 10:49:23 发布

阅读量495

点赞数

分类专栏： C/C++ 文章标签：代码分析测试

C/C++ 专栏收录该内容

16 篇文章 0 订阅

订阅专栏

有人写了一个测试程序

#include <stdlib.h>
#include <unistd.h>
#include <string.h>
#include <malloc.h>

main()
{
int alloc_time = 20000;
char* a[alloc_time];
char* b[alloc_time];
for(int j=0; j<5; j++)
{
for(int i=0; i<alloc_time; i++)
{
    a[i] = (char*)malloc(52722);
    memset(a[i], 1, 52722);
    b[i] = (char*)malloc(1);
    memset(b[i], 1, 1);
}
for(int i=0; i<alloc_time; i++)
{
    free(a[i]);
    free(b[i]);
}
}
while(1)
{
    sleep(10);
}
}

发现该程序在测试机上运行会占用1G内存，不释放，为了解决这个问题，特别去研究了一下glibc中malloc的源代码。

一．对于小于128k的块在heap中分配。

1.堆是通过brk的方式来增长或压缩的，如果在现有的堆中不能找到合适的chunk，会通过增长堆的方式来满足分配，如果堆顶的空闲块超过一定的阀值会收缩堆，所以只要堆顶的空间没释放，堆是一直不会收缩的。

2.堆中的分配信息是通过两个方式来记录。

第一．是通过chunk的头，chunk中的头一个字是记录前一个chunk的大小，第二个字是记录当前chunk的大小和一些标志位，从第三个字开始是要使用的内存。所以通过内存地址可以找到chunk，通过chunk也可以找到内存地址。还可以找到相邻的下一个chunk，和相邻的前一个chunk。一个堆完全是由n个chunk组成。

第二．是由3种队列记录，只用空闲chunk才会出现在队列中，使用的chunk不会出现在队列中。如果内存块是空闲的它会挂到其中一个队列中，它是通过内存复用的方式，使用空闲chunk的第3个字和第4个字当作它的前链和后链（变长块是第5个字和第6个字），省的再分配空间给它。

第一种队列是bins，bins有128个队列，前64个队列是定长的，每隔8个字节大小的块分配在一个队列，后面的64个队列是不定长的，就是在一个范围长度的都分配在一个队列中。所有长度小于512字节（大约）的都分配在定长的队列中。后面的64个队列是变长的队列，每个队列中的chunk都是从小到大排列的。

第二种队列是unsort队列（只有一个队列），（是一个缓冲）所有free下来的如果要进入bins队列中都要经过unsort队列。

第三种队列是fastbins，大约有10个定长队列，（是一个高速缓冲）所有free下来的并且长度是小于80的chunk就会进入这种队列中。进入此队列的chunk在free的时候并不修改使用位，目的是为了避免被相邻的块合并掉。

3.malloc的步骤

l 先在fastbins中找，如果能找到，从队列中取下后（不需要再置使用位为1了）立刻返回。

l 判断需求的块是否在小箱子（bins的前64个bin）范围，如果在小箱子的范围，并且刚好有需求的块，则直接返回内存地址；如果范围在大箱子（bins的后64个bin）里，则触发consolidate。（因为在大箱子找一般都要切割，所以要优先合并，避免过多碎片）

l 然后在unsort中取出一个chunk，如果能找到刚好和想要的chunk相同大小的chunk，立刻返回，如果不是想要chunk大小的chunk，就把他插入到bins对应的队列中去。转3，直到清空，或者一次循环了10000次。

l 然后才在bins中找，找到一个最小的能符合需求的chunk从队列中取下，如果剩下的大小还能建一个chunk，就把chunk分成两个部分，把剩下的chunk插入到unsort队列中去，把chunk的内存地址返回。

l 在topchunk（是堆顶的一个chunk，不会放到任何一个队列里的）找，如果能切出符合要求的，把剩下的一部分当作topchunk，然后返回内存地址。

l 如果fastbins不为空，触发consolidate即把所有的fanbins清空（是把fanbins的使用位置0，把相邻的块合并起来，然后挂到unsort队列中去），然后继续第3步。

l 还找不到话就调用sysalloc，其实就是增长堆了。然后返回内存地址。

4.free的步骤

l 如果和topchunk相邻，直接和topchunk合并，不会放到其他的空闲队列中去。

l 如果释放的大小小于80字节，就把它挂到fastbins中去，使用位仍然为1，当然更不会去合并相邻块。

l 如果释放块大小介于80-128k，把chunk的使用位置成0，然后试图合并相邻块，挂到unsort队列中去，如果合并后的大小大于64k，也会触发consolidate，（可能是周围比较多小块了吧），然后才试图去收缩堆。（收缩堆的条件是当前free的块大小加上前后能合并chunk的大小大于64k，并且要堆顶的大小要达到阀值，才有可能收缩堆）

l 对于大于128k的块，直接munmap

二．大于128k的块通过mmap的方式来分配。

根据以上的分析，我们可以得出为什么会还占用1G的内存。

测试程序有两重循环，内层循环先分配1G，然后全部释放，外层执行这个步骤5次，但为什么最后一次释放会不成功呢。

主要是因为按照这个程序分配后，内存变成由小块和大块交替出现，释放小块的时候，直接把小块放到fastbins中去，而且他的使用位还是1，释放大块的时候，它试图合并相邻的块，但是和它相邻的块的使用位还是1，所以它不能把相邻的块合并去来，而且释放的块的大小小于64k，也不会触发consolidate，即不会把fastbins清空，所以当所有的块都被释放完后，所有的小块都在fastbins里面，使用位都为1，大块都挂在unsort队列里面。全部都无法合并。所以使用的堆更加无法压缩。

如果在外循环后面再分配2000字节然后释放的话，所有内存将全部清空。这是因为在申请2000字节的时候，由malloc的第二步，程序会先调用consolidate，即把所有的fastbins清空，同时把相邻的块合并起来，等到所有的fastbins清空的时候，所有的块也被合并去来了，然后调用free2000字节的时候，这块被将被合并起来，成为topchunk，并且大小远大于64k，所有堆将会收缩，内存归还给系统。

terrytan18

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Glibc 的malloc源代码分析

有人写了一个测试程序#include #include #include #include main(){ int alloc_time = 20000; char* a[alloc_time]; char* b[alloc_time];for(int j=0; j{ for(int i=0; i { a[i] = (c
复制链接

扫一扫