Linux内存分布
- 代码段:二进制可执行代码。
- 数据段:已初始化的静态常量和全局变量。
- BSS段:未初始化的静态变量和全局变量。
- 堆段:动态分配的内存,从低地址开始向上增长。
- 文件映射段:动态库、共享内存,从低地址开始向上增长。
- 栈段:局部变量和函数调用的上下文等。栈大小固定,默认为8MB,可以自定义修改。
上面6个内存段中,堆和文件映射段的内存是动态分配的。
分配内存
malloc()是C库中函数,用于动态分配内存。malloc申请内存的时候,会有两种方式向操作系统申请内存。
- 方式一:通过brk()系统调用从堆分配内存。
- 方式二:通过mmap()系统调用在文件映射区域分配内存。
方式一通过brk()函数将堆顶指针向高地址移动,获得新的内存空间。
方式二通过mmap()系统调用中[私有匿名映射]的方式,在文件映射区分配一块内存,也就是从文件映射区"偷"了一块内存。
malloc()使用brk()和mmap()的场景:
- 如果用户分配的内存小于128KB,则通过brk()申请内存。
- 如果用户分配的内存大于128KB,则通过mmap()申请内存。
malloc()分配的是虚拟内存。如果分配后的虚拟内存没有被访问的话,虚拟内存是不会映射到物理内存的,这样就不会占用物理内存了。只有在访问已分配的虚拟地址空间的时候,操作系统通过查找页表,发现虚拟内存对应的也没有在物理内存中,就会触发缺页中断,然后操作系统会建立虚拟内存和物理内存之间的映射关系。
free()释放内存,会归还给操作系统吗?
- malloc通过brk()方式申请的内存,free释放内存的时候,并不会把内存归还给操作系统,而是缓存在malloc的内存池中,待下次使用;
- malloc通过mmap()方式申请的内存,free释放内存的时候,会把内存归还给操作系统,内存得到真正的释放。
为什么不全部使用mmap来分配内存?
因为向操作系统申请内存,是要通过系统调用的,执行系统调用是需要进入内核态的,然后回到用户态,运行态的切换回耗费不少时间。
另外,因为mmap分配的内存每次释放时候,都会归还给操作系统,于是每次mmap分配的虚拟地址都是缺页状态的,然后在第一次访问该虚拟地址的时候,就会触发缺页中断。
频繁通过mmap分配的内存,不仅每次都会发生运行态的切换,还会发生缺页中断(第一次访问虚拟地址后),这样会导致CPU消耗过大。
malloc 通过 brk() 系统调用在堆空间申请内存的时候,由于堆空间是连续的,所以直接预分配更大的内存来作为内存池,当内存释放的时候,就缓存在内存池中。
等下次在申请内存的时候,就直接从内存池取出对应的内存块就行了,而且可能这个内存块的虚拟地址与物理地址的映射关系还存在,这样不仅减少了系统调用的次数,也减少了缺页中断的次数,这将大大降低 CPU 的消耗。
free函数只传入一个内存地址,为什么能知道要释放多大的内存?
malloc申请内存时系统会多分配16字节,这个多出来的16字节就是保存了该内存块的描述信息,比如有该内存块的大小。
这样当执行free函数时,free会对传入进来的内存地址向左偏移16字节,然后从这个16字节的分析出当前的内存块的大小,自然就知道要释放多大的内存了。