Linux环境编程
一、内存管理
用户层
STL 自动分配/释放内存 调用C++
C++ new/delete 调用C
C malloc/free 调用POSIX或者Linux
POSIX brk/sbrk 调用内核
Linux mmap/munmap 调用内核kernal
系统层
kernal kmalloc/vmalloc 调用驱动
驱动 get_free_page
二、进程映像
程序是存储在磁盘上的可执行文件,当执行程序时,系统会把可执行程序加载到内存中,在内存中
形成了进程(一个程序可以同时加载多个进程)
进程的内存分布情况就是所谓的进程映像,从地地址到高地址依次分布为:
text 代码段 二进制指令、常量(字符串字面值、被const修饰过的原data段的数据)
data 数据段 初始化过的全局变量和静态局部变量
bss 静态数据段 未初始化的全局变量和未初始化过的静态局部变量 程序运行前,会自动清0
heap 堆 由程序员手动管理的体量较大的数据
stack 栈 局部变量、块变量
environ 环境变量表 环境变量
每个进程都有一份,修改也不会影响其它进程
argv 命令行参数 程序运行前命令行附加的参数
/proc/进程id/maps
查询进程id 命令:ps -aux ./a.out
函数:getpid()
三、虚拟内存
1、系统会为每个进程分配4G的虚拟内存空间
2、用户只能使用虚拟内存,无法直接使用物理内存
3、虚拟地址与物理内存进行映射后才能使用 否则就会产生段错误
4、虚拟地址与物理内存之间的映射是有2操作系统动态维护
5、让用户使用虚拟地址一方面是为了安全,另一方面操作可以让应用程序使用
比实际物理内存更大的地址空间
6、4G的虚拟地址空间分为两个部分
[0G~3G)用户空间
[3G~4G] 内核空间
7、用户空间中的代码不能直接访问内核空间的代码和数据,可以通过系统调用(API)从用户态
切换到内核态后,间接地与内核交换数据
8、对虚拟内存越界访问(使用了没有映射过的虚拟内存),导致段错误
四、映射虚拟内存与物理内存的函数:
sbrk/brk/mmap/munmap
关于 malloc获取映射好的虚拟内存地址的底层逻辑:
1、如果分配的内存小于128Kb 调用sbrk\brk
2、如果大于128Kb,mmap/munmap
系统内部维护着一个指针指向内存映射的最后一个字节的下一个字节
注意:系统映射内存是以页(1页=4096字节)为单位的
void *sbrk(intptr_t increment);
功能: 根据增量参数调整该指针的位置,既能映射也能取消映射
increment:增量
0 获取指针的位置
>0 映射内存
<0 取消映射
返回值: 返回该指针在移动前的位置
int brk(void *addr);
功能: 直接使用addr的值修改该指针的位置,既能映射也能取消映射
addr:
>位置指针 映射内存
<位置指针 取消映射
返回值: 成功返回0,失败返回-1
注意:sbrk/brk 属于POSIX标准中的内存映射函数,都可以单独映射、取消映
射,但是配合使用最方便(sbrk映射、brk取消映射)
#include <sys/mman.h>
void *mmap(void *addr, size_t length, int prot, int flags,int fd, off_t offset);
功能: 映射虚拟内存与物理内存
addr:要映射的区域的首地址,可以自己指定,如果是NULL则系统帮你指定
length:映射的字节长度
prot:映射的权限
PROT_EXEC 执行权限
PORT_READ 读权限
PORT_WRITE 写权限
PROT_NONE 没有权限
例如:读写PORT_READ | PORT_WRITE
flags:映射标志:
MAP_ANONYMOUS 将虚拟内存映射到物理内存,而不是映射文件,因此忽略fd、offset等参数,必须与MAP_SHARED或
MAP_PRIVATE配合使用
MAP_SHARED 将虚拟内存映射到文件,并共享映射
MAP_PRIVATE 将虚拟内存映射到文件,不共享映射
fd:文描述符
不映射文件给0
offset:文件的偏移量
不映射文件给0
返回值: 成功返回映射后的首地址 失败返回MAP_FAILED((void*)-1) 等同0xFFFFFFFF
int munmap(void *addr, size_t length);
功能:取消映射
addr:要取消映射的区域的首地址
length:要取消映射的字节数
五、内存管理的总结
1、sbrk/brk底层维护了一个指针,该指针记录着映射内存的结尾,移动该指针就会映射、取消映射,
映射的内存属于堆内存
2、mmap/munmap 底层不维护任何东西,如果mmap映射成功返回映射后的内存首地址
3、malloc/free 底层调用了sbrk/brk/mmap/munmap
4、每个进程都有4个G的虚拟地址空间,虚拟地址空间只是虚假的地址编号,并不是真实物理内存地址编号,
虚拟地址必须与物理内存进行映射后才能使用
5、平时所说的堆内存的分配与释放有两层含义:
a、权限的分配与回收
b、映射关系的建立
6、重点是理解Linux系统对于内存的管理机制,而不是sbrk/brk/mmap/munmap的用法