C 语言中,经常有这样的需求:分配一块内存,并且初始化为0:
很多人会写如下的代码:
char *mem = (char*) malloc (size);
if (!mem)
exit(-1);
memset(mem, 0, size);
上诉代码可以很好的工作,但是有更好的做法:
char * mem = (char*) calloc(size, 1);
calloc 就是malloc + clear (清零);这个写法好在哪里呢?
这个要从linux 系统调用mmap说起;
linux mmap系统调用有一个特点,对于anonymous map(不是map文件),mmap会对分配出来的内存清零。具体实现是这样的:
a. 对于anonymous map,内核把相应的虚拟地址页统统影射到固定的zero page;所以读取map出来的内存自然返回0;
b. 同时页面标记成只读。当写操作发生时,触发写异常(page fault),内核依赖COW(copy-on-write),真正分配内存,修改地址映射,最后清零;(参看wiki:
http://en.wikipedia.org/wiki/Copy-on-write)
mmap的自动清零就是为了calloc这类需求量身定做的, 它有两个优点:
1.
时间:避免了用户态清零带来的时间开销;
2.
空间:尽可能减少物理内存开销。用户态清零动作会触发内核来分配物理分配。有些时候,程序分配了一大块内存,但不见得使用;即时使用了,有时候部分内存也是只读的。这时候calloc就可以避免消耗物理内存;
哪些地方还使用了mmap的清零特性呢?
典型的是程序的
BSS段。BSS段在加载的时候需要自动清零。
mmap即实现了内存分配,又完成了清零动作;
如果你去看android libc(bionic) linker代码,加载BBS段代码中就有如下的注释:
/* TODO: Check if we need to memset-0 this region.
* Anonymous mappings are zero-filled copy-on-writes, so we
* shouldn't need to. */
补充:
在stackoverflow上看到有人问类似的问题,还贴出了calloc和malloc实现的代码比较,参看
http://stackoverflow.com/questions/2688466/why-mallocmemset-slower-than-calloc