malloc原理
malloc它有一个将可用的内存块连接为一个长长的列表的所谓空闲链表。调用malloc函数时,它沿连接表寻找一个大到足以满足 用户请求所需要的内存块。然后,将该内存块一分为二(一块的大小与用户请求的大小相等,另一块的大小就是剩下的字节)。接下来,将分配给用户的那块内存传 给用户,并将剩下的那块(如果有的话)返回到连接表上。调用free函数时,它将用户释放的内存块连接到空闲链上。到最后,空闲链会被切成很多的小内存片 段,如果这时用户申请一个大的内存片段,那么空闲链上可能没有可以满足用户要求的片段了。于是,malloc函数请求延时,并开始在空闲链上翻箱倒柜地检 查各内存片段,对它们进行整理,将相邻的小空闲块合并成较大的内存块。
查询链表的方法:
break指针
Linux维护一个break指针,这个指针指向堆空间的某个地址。从堆起始地址到break之间的地址空间为映射好的,可以供进程访问;而从break往上,是未映射的地址空间,如果访问这段空间则程序会报错。我们用malloc进行内存分配就是从break往上进行的。
First fit:从头开始,使用第一个数据区大小大于要求size的块所谓此次分配的块。首次适配有更好的运行效率。
Best fit:从头开始,遍历所有块,使用数据区大小大于size且差值最小的块作为此次分配的块。最佳适配具有较高的内存使用率。
int brk(void *addr);
void *sbrk(intptr_t increment);
brk将break指针直接设置为某个地址;
而sbrk将break从当前位置移动increment所指定的增量,如果将increment设置为0,则可以获得当前break的地址。
malloc实现:
void* malloc(unsigned size); 在堆内存中分配一块长度为size字节的连续区域,参数size为需要内存空间的长度。
#include <sys/types.h>
#include <unistd.h>
typedef struct s_block *t_block;
struct s_block {
size_t size; // 数据区大小
t_block next; // 指向下个块的指针
int free; // 是否是空闲块
int padding; // 填充4字节,保证meta块长度为8的倍数
char data[1] // 这是一个虚拟字段,表示数据块的第一个字节,长度不应计入meta
};
//首次适配
t_block find_block(t_block *last, size_t size) {
t_block b = first_block;
while(b && !(b->free && b->size >= size)) {
*last = b;
b = b->next;
}
return b;
}
//如果现有block都不能满足size的要求,
//则需要在链表最后开辟一个新的block。
//这里关键是如何只使用sbrk创建一个struct
#define BLOCK_SIZE 24 //由于存在虚拟的data字段,sizeof不能正确计算meta长度,这里手工设置
t_block extend_heap(t_block last, size_t s) {
t_block b;
b = sbrk(0);
if(sbrk(BLOCK_SIZE + s) == (void *)-1)
return NULL;
b->size = s;
b->next = NULL;
if(last)
last->next = b;
b->free = 0;
return b;
}
//First fit有一个比较致命的缺点,
//就是可能会让很小的size占据很大的一块block,
//此时,为了提高payload,应该在剩余数据区足够大的情况下,将其分裂为一个新的block,
void split_block(t_block b, size_t s) {
t_block newb;
newb = b->data + s;
newb->size = b->size - s - BLOCK_SIZE ;
newb->next = b->next;
newb->free = 1;
b->size = s;
b->next = newb;
}
//由于我们希望malloc分配的数据区是按8字节对齐,
//所以在size不为8的倍数时,我们需要将size调整为大于size的最小的8的倍数:
size_t align8(size_t s) {
if(s & 0x7 == 0)
return s;
return ((s >> 3) + 1) << 3;
}
void *first_block=NULL;
void *malloc(size_t size) {
t_block b, last;
size_t s;
/* 对齐地址 */
s = align8(size);
if(first_block) {
/* 查找合适的block */
last = first_block;
b = find_block(&last, s);
if(b) {<pre name="code" class="cpp"> /* 如果可以,则分裂 */
if ((b->size - s) >= ( BLOCK_SIZE + 8))
split_block(b, s);
b->free = 0;
} else {
/* 没有合适的block,开辟一个新的 */
b = extend_heap(last, s);
if(!b)
return NULL;
}
} else {
b = extend_heap(NULL, s);
if(!b)
return NULL;
first_block = b;
}
return b->data;
}
calloc实现:
void* calloc(size_t numElements, size_t sizeOfElement);
与malloc相似,参数sizeOfElement为单位元素长度(例如:sizeof(int)),numElements为元素个数,即在内存中申请numElements * sizeOfElement字节大小的连续内存空间。并且会把内存初始化为0。
calloc(num, size) 基本上等于 void *p = malloc(num * size); memset(p, 0, num * size); 但理论上 calloc 的实现可避免 num * size 溢出,当溢出时返回 NULL 代表失败,而 malloc(num * size) 可能会分配了一个尺寸溢出后的内存。
由于我们的数据区是按8字节对齐的,所以为了提高效率,我们可以每8字节一组置0,而不是一个一个字节设置。我们可以通过新建一个size_t指针,将内存区域强制看做size_t类型来实现。
void *calloc(size_t number, size_t size) {
size_t *news;
size_t s8, i;
news = malloc(number * size);
if(news) {
s8 = align8(number * size) >> 3;
for(i = 0; i < s8; i++)
news[i] = 0;
}
return news;
}
realloc实现:
void* realloc(void* ptr, unsigned newsize);
使用realloc函数为ptr重新分配大小为size的一块内存空间。下面是这个函数的工作流程:
- 对ptr进行判断,如果ptr为NULL,则函数相当于malloc(new_size),试着分配一块大小为new_size的内存,如果成功将地址返回,否则返回NULL。如果ptr不为NULL,则进入2。
- 查看ptr是不是在堆中,如果不是的话会抛出realloc invalid pointer异常。如果ptr在堆中,则查看new_size大小,如果new_size大小为0,则相当于free(ptr),将ptr指向的内存空间释放掉,返回NULL。如果new_size小于原大小,则ptr中的数据可能会丢失,只有new_size大小的数据会保存;如果size等于原大小,等于什么都没有做;如果size大于原大小,则查看ptr指向的位置还有没有足够的连续内存空间,如果有的话,分配更多的空间,返回的地址和ptr相同,如果没有的话,在更大的空间内查找,如果找到size大小的空间,将旧的内容拷贝到新的内存中,把旧的内存释放掉,则返回新地址,否则返回NULL。
//为了实现realloc,我们首先要实现一个内存复制方法。
//如同calloc一样,为了效率,我们以8字节为单位进行复制
void copy_block(t_block src, t_block dst) {
size_t *sdata, *ddata;
size_t i;
sdata = src->ptr;
ddata = dst->ptr;
for(i = 0; (i * 8) < src->size && (i * 8) < dst->size; i++)
ddata[i] = sdata[i];
}
void *realloc(void *p, size_t size)
{
size_t s;
t_block b, newb;
void *newp;
if (!p)/* 根据标准库文档,当p传入NULL时,相当于调用malloc */
return malloc(size);
if(valid_addr(p))
{
s = align8(size);
b = get_block(p);
if(b->size >= s)
{
if(b->size - s >= (BLOCK_SIZE + 8))
split_block(b,s);
}
else
{
/* 看是否可进行合并 */
if(b->next && b->next->free&& (b->size + BLOCK_SIZE + b->next->size) >= s)
{
fusion(b);
if(b->size - s >= (BLOCK_SIZE + 8))
split_block(b, s);
}
else
{
/* 新malloc */
newp = malloc (s);
if (!newp)
return NULL;
newb = get_block(newp);
copy_block(b, new);
free(p);
return(newp);
}
}
return (p);
}
return NULL;
}
free实现:
- 如何验证所传入的地址是有效地址,即确实是通过malloc方式分配的数据区首地址
地址应该在之前malloc所分配的区域内,即在first_block和当前break指针范围内;
这个地址确实是之前通过我们自己的malloc分配的。 - 如何解决碎片问题
//首先我们在结构体中增加magic pointer(同时要修改BLOCK_SIZE)
typedef struct s_block *t_block;
struct s_block {
size_t size; // 数据区大小
t_block next; // 指向下个块的指针
int free; // 是否是空闲块
int padding; // 填充4字节,保证meta块长度为8的倍数
char data[1] // 这是一个虚拟字段,表示数据块的第一个字节,长度不应计入meta
void *ptr; // Magic pointer,指向data
};
#define BLOCK_SIZE 24
//我们定义检查地址合法性的函数:
t_block get_block(void *p)
{
char *tmp;
tmp = p;
return (p = tmp -= BLOCK_SIZE);
}
int valid_addr(void *p)
{
if(first_block) {
if(p > first_block && p < sbrk(0))
{
return p == (get_block(p))->ptr;
}
}
return 0;
}
将block和相邻block合并。为了满足这个实现,需要将s_block改为双向链表。修改后的block结构如下:
typedef struct s_block *t_block;
struct s_block {
size_t size; /* 数据区大小 */
t_block prev; /* 指向上个块的指针 */
t_block next; /* 指向下个块的指针 */
int free; /* 是否是空闲块 */
int padding; /* 填充4字节,保证meta块长度为8的倍数 */
void *ptr; /* Magic pointer,指向data */
char data[1] /* 这是一个虚拟字段,表示数据块的第一个字节,长度不应计入meta */
};
#define BLOCK_SIZE 28
合并方法如下:
t_block fusion(t_block b) {
if (b->next && b->next->free) {
b->size += BLOCK_SIZE + b->next->size;
b->next = b->next->next;
if(b->next)
b->next->prev = b;
}
return b;
}
void free(void *p)
{
t_block b;
if(valid_addr(p)) {
b = get_block(p);
b->free = 1;
if(b->prev && b->prev->free)
b = fusion(b->prev);
if(b->next)
fusion(b);
else
{
if(b->prev)
b->prev->prev = NULL;
else
first_block = NULL;
brk(b);
}
}
}