一、内存管理
用户层
STL 智能指针/容器 自动分配、释放 调用C++
C++ new/delete 调用C
C malloc/free 调用POSIX\Linux
POSIX brk/sbrk 调用内核
Linux mmap/munmap 调用内核
系统层
Kernal kmalloc/vmalloc 调用驱动
dirver get_free_page
二、进程映像
程序存储在磁盘上的可执行文件(脚本、二进制),当执行程序时,系统会把可执行文件加载到内存形成进程,一个程序可以同时加载出多个进程
进程在内存中的分布情况就是进程映像,从低地址到高地址依次是:
text 代码段: 二进制指令、常量(数值、"字符串字面值"、被const修饰过的原data的数据)
只读,强制修改会段错误
data 数据段: 初始化过的全局变量、初始化过的静态局部变量
bss 静态数据段:未初始化过的全局变量、未初始化过的静态局部变量
程序运行前会自动清0 初始化为0也是未初始化过
heap 堆: 程序员手动管理的大量数据,管理麻烦、申请和释放受控,与指针配合使用,使用不当可能会内存泄漏、内存碎片
stack 栈: 局部变量、块变量
大小有限、自动申请、释放
environ 环境变量表:所有的环境变量
每个进程都有一份,修改不会影响系统真正的环境变量的值
argv 命令行参数:
程序执行时附带的参数
查看进程ID:
命令:ps -aux 函数:getpid()
三、虚拟内存
1、32位系统会给每个进程分配4G的虚拟内存空间
2、进程、用户只能使用访问虚拟内存,无法直接使用真实的物理内存
3、虚拟内存只有与物理内存进行映射后才能使用,否则会产生段错误
4、虚拟内存与物理内存的映射和对应使用都是由操作系统动态维护
5、虚拟内存技术一方面是为了让系统更加安全,可以不暴露真实的物理内存地址给用户,又可以让一个进程出错后不影响其他进程和系统的运行,
另一方面可让进程使用比实际物理内存更大的空间
6、4G的虚拟内存地址分成两个部分
[0~3G) 用户空间
[3G~4G) 内核空间
7、当进程\线程运行在内核空间时,称该进程\线程处于内核态,当进程\线程运行在用户空间时,称该进程\线程处于用户态
8、在内核态下,进程运行在内核空间,此时CPU可以执行任何指令,此时运行的代码不受任何限制,可以自由访问任何有效的地址
9、在用户态下,进程运行在用户空间,此时进程不能直接访问内核空间的数据,可以通过系统调用(API 系统接口函数)的方式切换到内核态,
间接地访问内核空间的数据
10、对虚拟内存越界访问(访问没有映射过的虚拟内存),导致段错误
四、映射虚拟内存与物理内存的函数
sbrk/brk/mmap/munmap
关于 malloc 获取虚拟内存实际调用POSIX还是Linux提供的函数受到操作系统、编译器、字节数的影响,大致逻辑:
1、如果申请小于128Kb调用sbrk\brk
2、如果申请大于128Kb调用mmap\munmap
注意:strace ./a.out 可以追踪程序的底层调用(用户层)
注意:系统内存映射是以页(1页=4096字节)为单位的
注意:sbrk、brk底层维护一个映射位置指针,该指针指向虚拟内存中映射过的内存的最后一个字节的下一个位置,
可以通过移动该指针来实现映射内存和取消映射的效果
void *sbrk(intptr_t increment);
功能:通过增量increment来调整映射位置指针的位置,从而进行映射或取消映射
increment:增量(字节为单位)
0 获取映射位置指针的位置
>0 映射内存
<0 取消映射
返回值:映射指针原来的位置
int brk(void *addr);
功能:通过修改映射指针指向addr的地址,从而进行映射或取消映射
addr:
> 原来位置 映射
< 原来位置 取消映射
返回值:成功返回0 失败返回-1
总结:sbrk、brk都属于POSIX标准中的内存映射函数,都是可以单独进行映射、取消映射,但是配合使用最方便(sbrk映射、brk取消映射)
#include <sys/mman.h>
void *mmap(void *addr, size_t length, int prot, int flags,
int fd, off_t offset);
功能:映射虚拟内存与物理内存
addr:映射内存的起始地址,可以自己指定,如果赋NULL则由操作系统指定
length:要映射的字节数
prot:映射后的权限
PROT_EXEC 执行权限 PROT_EXEX | PROT_READ
PROT_READ 读权限
PROT_WRITE 写权限
PROT_NONE 没有权限
flags:映射标志
MAP_FIXED 如果提供的addr无法映射,则直接失败
MAP_ANONYMOUS 指定映射虚拟内存,不映射文件,fd、offset失效
MAP_SHARED 对映射后的内存可以共享给其他进程
MAP_PRIVATE 对映射后的内存只能当前进程使用
注意:flags中必须在MAP_SHARED、MAP_PRIVATE之间二选一
fd:文件描述符 可以让文件映射到物理内存,不需要映射文件直接写0
offset:文件的偏移位置,从该位置开始映射文件
返回值:成功返回映射后的内存首地址,失败返回(void*)-1
int munmap(void *addr, size_t length);
功能:取消映射
addr:映射的内存首地址
length:取消映射的字节数
返回值:成功返回0 失败返回-1
五、Linux内存管理总结
1、mmap\munmap底层不维护任何东西,直接在堆内存中选择合适的内存进行映射,返回映射成功后的内存首地址
2、sbrk\brk底层维护一个映射位置指针,该指针记录了通过sbrk\brk映射内存的末尾位置,通过改变该指针的位置来映射和取消映射
3、malloc\free底层调用了sbrk\brk 或者 mmap\munmap,虚拟内存必须与物理内存建立映射关系后才能使用
4、每个进程都有4G(32位)的虚拟内存空间
5、内存管理的重点是理解Linux对内存管理机制,而不是sbrk\brk\mmap\munmap函数的使用
六、系统调用(系统API、系统函数)
系统调用指的是由操作系统提供的一些功能给程序员调用,这些功能已经被封装成C语言函数的形式,但是它们不属于标准C的一部分,也不真正的函数
一般的应用进程工作运行在用户态(0~3G),使用系统调用时进程会转入到内核态(3~4G)
常用的C标准库函数的大部分时间都工作在用户态,当底层进行系统调用时会偶尔转入内核态工作
通过time命令查看进程在两种状态下的运行时间情况:
real 0m0.001s 总执行时间
user 0m0.001s 用户态执行时间
sys 0m0.000s 内核态执行时间
系统调用的代码是内核的一部分,其外部接口以C函数的形式存储在共享库中(linux-gate.so.1 、 /lib/ld-linux.so.2),
当调用这些外部接口时进程会以软中断的方式进入内核态执行真正的系统调用函数
七,环境变量表:
操作系统会给每个执行的程序(进程)提供一张环境变量表,该表中记录了操作系统在提供的时候所处于的所有环境变量,
这些环境变量反映了操作系统的配置情况以及该程序所处操作系统中的环境情况
通过声明 extern char** environ; 就可以使用该程序的环境变量表
这个表可以随意使用,因为它只是操作系统提供的一张拷贝表而已
for(int i=0; environ && environ[i]; i++){
printf("%s\n",environ[i]);
}
操作环境变量表的函数:
char *getenv(const char *name);
功能:通过环境变量名获取它的值
int setenv(const char *name,const char *value,int overwrite);
功能:向环境变量表中添加新的环境变量
name:环境变量名
value:环境变量的值
overwrite: 当环境变量存在时
非0 修改原来环境变量的值
0 不修改
返回值:成功返回0 失败返回-1
int putenv(char *string);
功能:向环境变量表中添加新的环境变量或修改值
string:以 环境变量名=环境变量值
int unsetenv(const char *name);
功能:删除环境变量
返回值:成功返回0 失败返回-1
int clearenv(void);
功能:清空环境变量表
错误处理:
1、通过函数返回值表示出现错误
a、合法值表示成功、非法值表示失败
例如:查找位置、计算大小等
b、返回值是指针类型时,返回NULL或者0xFFFFFFFF表示失败,其余都表示成功
malloc\mmap
c、返回0表示成功,-1表示失败,一般都是操作系统函数
d、永远成功 例如:printf
2、通过改变全局的错误编号,来表示出现了错误
errno 定义在 errno.h中
由于系统函数执行导致出现错误,就会改变errno的值
char *strerror(int errnum);
功能:根据errno的值获取对应的错误提示信息
注意:errno是一个全局变量,所以不能只根据它的值是否为0就简单地判断是否产生错误