进程内存空间分布
一个程序的内存空间主要如下:
- 代码段(text segment):只读权限;常是指用来存放程序执行代码的一块内存区域,这部分区域的大小在程序运行前就已经确定,并且内存区域通常属于只读, 某些架构也允许代码段为可写,即允许修改程序。在代码段中,也有可能包含一些只读的常数变量,例如字符串常量等。
- 数据段(data segment):读写权限;存已被初始化了的静态数据。数据段(data segment )通常是指用来存放程序中已初始化的全局变量或者静态变量的一块内存区域。
- BSS 段(Block Started by Symbol ):未初始化的数据段. 通常是指用来存放程序中未初始化的全局变量的一块内存区域,当全局变量未初始化(或者被初始化为0时)时在bss段会为该变量填充0。 关于
.data
,.bss
和.text
段的内存分布验证可以参考后面描述size binary_name
命令验证 - 常量数据段(.rodata)
ro表read only,用于存放不可变修改的常量数据,一旦程序中对其修改将会出现段错误
(1) 程序中的常量不一定就放在rodata中,有的立即数和指令编码放在.text中
(2)对于字符串常量,若程序中存在重复的字符串,编译器会保证只存在一个,一般声明形式为const char * xxx
(3)rodata是在多个进程间共享的
该数据段的查看方式如下:size -A test_memory
- 堆(heap ): 堆是用于存放进程运行中被动态分配的内存段,它的大小并不固定,可动态扩张或缩减。当进程调用malloc 等函数分配内存时,新分配的内存就被动态添加到堆上(堆被扩张);当利用free 等函数释放内存时,被释放的内存从堆中被剔除(堆被缩减)
- 栈(stack) :是用户存放程序临时创建的局部变量,也就是说我们函数括弧“{} ”中定义的变量(但不包括static 声明的变量,static 意味着在数据段中存放变量)
- comment段
它存放的是编译器版本等信息。除了.comment,还有.note、.hash等其他段,了解即可。
以上中:.bss
,.text
,.data
,.rodata
,堆,栈为主要内存占用数据区,其他并非重要内存占用,想要详细了解的可以通过size -A binary_file
或者objdum -x binary_file
查看。
在32位操作系统下,进程内存的分布如下,当前进程总共可用内存空间大小是4G,因为现阶段我们的操作系统普遍为多任务实时操作系统,用户态的进程处理结果最终是需要内核去完成,所以此时一个进程空间会预留1G让内核使用:
而64位操作系统理论上是对进程内存空间的占用不做限制。
size命令查看内存分布
使用命令size binary_file
可以看到当前二进制文件中text,data,bss段内存占用情况,如下代码,针对初始化全局变量和未初始化全局变量的data,bss段内存分布查看如下。
#include <stdio.h>
int a[10];
//全局变量/静态变量未初始化,或者被初始化为0时分布在bss段
//int b[0]={0};
int main()
{
return 0;
}
此时全局变量未初始化,将分布在bss段。输出如下:
zhanghuigui@ubuntu:~/test$ size test_memory
text data bss dec hex filename
1358 544 72 1974 7b6 test_memory
使用非0初始化全局变量后内存分布如下
#include <stdio.h>
int a[10]={1,2,3,4,5,6,7,8,9,10};
int main()
{
return 0;
}
使用非0初始化全局变量后,该内存将分布在data段,输出如下
zhanghuigui@ubuntu:~/test$ size test_memory
text data bss dec hex filename
1358 600 8 1966 7ae test_memory
堆方式内存分配和栈方式内存分配比较
- 申请方式
stack: 由系统自动分配。
heap: 需要程序员自己申请,并指明大小,在 C 中 用malloc 函数, C++ 中是 new 运算符。 - 申请后系统的响应
栈:只要栈的剩余空间大于所申请空间,系统将为程序提供内存,否则将报异常提示栈溢出。
堆:首先应该知道操作系统有一个记录空闲内存地址的链表,当系统收到程序的申请时,会遍历该链表,寻找第一个空间大于所申请空间的堆结点,然后将该结点从空闲结点链表中删除,并将该结点的空间分配给程序。
由于找到的堆结点的大小不一定正好等于申请的大小,系统会自动的将多余的那部分重新放入空闲链表中 - 申请大小的限制
栈:在Windows下,栈是向低地址扩展的数据结构,是一块连续的内存的区域。意思是栈顶的地址和栈的最大容量是系统预先规定好的,在Windows下,栈的大小是 2M (也有的说是 1M ,总之是一个编译时就确定的常数),如果申请的空间超过栈的剩余空间时,将提示overflow。因此,能从栈获得的空间较小。
堆:堆是向高地址扩展的数据结构,是不连续的内存区域。这是由于系统是用链表来存储的空闲内存地址的,自然是不连续的,而链表的遍历方向是由低地址向高地址。堆的大小受限于计算机系统中有效的虚拟内存。由此可见,堆获得的空间比较灵活,也比较大。 - 申请效率的比较
栈由系统自动分配,存在栈操作的机器指令,速度较快。但程序员是无法控制内存分配的 。
堆是由 new /malloc分配的内存,一般速度比较慢,而且容易产生内存碎片 , 不过用起来方便 ,可以通过delete/free进行回收。 - 存储内容比较
栈中主要存放的是函数名,变量,返回值等,函数运行时以栈帧的形式push到栈中,函数退出时按照栈的方式pop出栈。
堆中存储的内容可以自己去设定,比较自由
使用stap 深入追踪malloc逻辑
关于systemtap工具的使用可以参考s-systemtap工具使用图谱
想要查看glibc对malloc从用户态到内核态的实现,可以参考如下步骤
测试代码:
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
int main()
{
char *str;
str = (char *)malloc(sizeof(char));
if (!str) {
printf("malloc_error\n");
_exit(-1);
}
return 0;
}
编译gcc test.c -o test
编写stp探测脚本对malloc流程进行监控
#!/usr/bin/stap
probe begin {
printf("begin to probe\n");
}
probe syscall.* { #对系统所有的系统调用进行探测
procname=execname();
if(procname=="test") { #匹配以上c代码编译好的test二进制文件
printf("%s[%d]: %s -> %s\n", procname,pid(),name,ppfunc()); #name 为此时malloc实现(glibc)中的函数,ppfunc为系统调用名称
}
}
probe end {
printf("end to probe\n");
}
运行探测脚本,当输出begin to probe的时候运行test,则会有如下输出,调用过程较为清晰
begin to probe
test[1461716]: brk -> SyS_brk #brk为glibc实现的函数,而Sys_brk则为系统调用
test[1461716]: mmap2 -> SyS_mmap_pgoff
test[1461716]: access -> SyS_access
test[1461716]: open -> SyS_open
test[1461716]: fstat -> SyS_newfstat
test[1461716]: mmap2 -> SyS_mmap_pgoff
test[1461716]: close -> SyS_close
test[1461716]: open -> SyS_open
test[1461716]: read -> SyS_read
test[1461716]: fstat -> SyS_newfstat
test[1461716]: mmap2 -> SyS_mmap_pgoff
test[1461716]: mprotect -> SyS_mprotect
test[1461716]: mmap2 -> SyS_mmap_pgoff
test[1461716]: mmap2 -> SyS_mmap_pgoff
test[1461716]: close -> SyS_close
test[1461716]: mmap2 -> SyS_mmap_pgoff
test[1461716]: mmap2 -> SyS_mmap_pgoff
test[1461716]: arch_prctl -> sys_arch_prctl
test[1461716]: mprotect -> SyS_mprotect
test[1461716]: mprotect -> SyS_mprotect
test[1461716]: mprotect -> SyS_mprotect
test[1461716]: munmap -> SyS_munmap
test[1461716]: brk -> SyS_brk
test[1461716]: brk -> SyS_brk
test[1461716]: brk -> SyS_brk
test[1461716]: exit_group -> SyS_exit_group
参考文档:
https//blog.csdn.net/jirryzhang/article/details/79518408
https://blog.csdn.net/baidu_37964071/article/details/81428139
https://www.jianshu.com/p/f9760cb3cea2
https://blog.csdn.net/DLUTBruceZhang/article/details/9080157?utm_source=copy