Linux内存管理(text、rodata、data、bss、stack&heap)

近期在解决一个编译问题时,一直在考虑一个问题,那就是Linux下可执行程序执行时内存是什么状态,是依照什么方式分配内存并执行的。

linux下内存管理是通过虚存管理的,在分配内存时并不是在物理内存开辟了一段空间,而是在使用时才分配的。并且是通过段页式管理。

linux下内存分配是以页为单位的。而页是通过段管理。各个段之间是独立的,方便管理。linux程序执行时能够分为下面几个内存段:

text、rodata、data、bss、stack、heap。

一、各内存区段的介绍

系统内的程序分为程序段和数据段,具体又可细分为一下几个部分:

(1)text段-代码段

text段存放程序代码,运行前就已经确定(编译时确定),通常为只读,可以直接在ROM或Flash中执行,无需加载到RAM。

在嵌入式开发中,有时为了特别的需求(例如加速),也可将某个模块搬移到RAM中执行。

(2)rodata段(read-only-data)-常量区

rodata段存储常量数据,比如程序中定义为const的全局变量,#define定义的常量,以及诸如“Hello World”的字符串常量。只读数据,存储在ROM中。

注意:有些立即数与指令编译在一起,放在text段。

const修饰的全局变量在常量区。const修饰的局部变量只是为了防止修改,没有放入常量区。

编译器会去掉重复的字符串常量,程序的每个字符串常量只有一份。

有些系统中rodata段是多个进程共享的,目的是为了提高空间利用率。

(3)data段

data存储已经初始化的全局变量,属于静态内存分配。(注意:初始化为0的全局变量还是被保存在BSS段)

static声明的变量也存储在数据段。

链接时初值加入执行文件。执行时,因为这些变量的值是可以被改变的,所以执行时期必须将其从ROM或Flash搬移到RAM。总之,data段会被加入ROM,但却要寻址到RAM的地址。

(4)bss段

bss段存储没有初值的全局变量或默认为0的全局变量,属于静态内存分配。

bss段不占据执行文件空间(无需加入程序之中,只要链接时将其寻址到RAM即可),但占据程序运行时的内存空间。

执行期间必须将bss段内容全部设为0。

(5)stack段-栈

stack段存储参数变量和局部变量,由系统进行申请和释放,属于静态内存分配。

stack的特点是先进先出,可用于保存/恢复调用现场。

栈的概念来自数据结构,栈只能在一端操作,所以先入栈的后出。

“先进后出”,这种结构保护之前的现场,如一个函数被调用后,产生的临时变量都会存到栈区的顶部,当函数完成后,会自动从顶部将刚使用的数据销毁。另外栈区的地址是从高地址向下增长的。

(6)heap-堆

heap段是程序运行过程中动态分配的内存段,由用户申请和释放(例如malloc和free)。

申请时至少分配虚存,当真正存储数据时才分配物理内存。释放时也不是立即释放物理内存,而是可能被重复利用。

堆区,用来动态内存分配,如malloc, new申请的内存,由程序员分配释放。

程序中不释放,则程序结束时,由OS回收。据说这个和数据结构中的堆 没有什么关系。堆区使用时地址向上增长。

程序在执行时,会产生临时变量或是函数返回值,还有函数中动态分配的地址空间,如malloc, new等…

根据这些需求,才需要堆和栈的出现,所以堆(heap)和栈(Stack)这两个段是在程序运行时才有.

二、总结

1、执行文件中包含了text、rodata、data段的内容,不包含bss段内容(一堆0放入执行文件没有意义)。

2、程序被存储的地址和执行时期的地址不一定一致。

LMA(load memory address):某程序区被存储的地址。

VMA(virtual memory address):程序区段在执行时期的地址。

例如data段会被存储在ROM,但执行时必须加载到RAM,则在ROM中的地址就称为LMA,在RAM中的地址就是VMA。

3、堆和栈的内存增长方向是相反的:栈是从高地址向低地址生长,堆是从低地址向高地址生长。

4、局部变量存储在stack中,编写函数时要注意如果该函数被递归调用很多次,可能会引起stack overflow的问题。

(尤其在嵌入式开发中,内存资源有限,所有内存几乎都会被填满,stack overflow和stack unserflow都极可能引起很大问题)

执行过程:

代码区的指令依次执行。代码由操作码和操作数组成,操作码决定是顺序执行,还是跳转,还是循环等。

操作数可能是立即数,即具体的数直接包含在代码中,或者是局部变量,则在栈区分配空间,然后引用该数据地址执行,或者是BSS,DATA段的数据,同样引用其地址执行。

正因为代码有不同的操作,所以程序在内存中执行时,才分成不同的区,以便节约空间或访问方便。

对于全局变量和静态变量,一般不会更改其值,但整个执行过程都需要访问,就单独放到一个区进行管理。

临时变量生命周期短,需要频繁的操作,则统一放到栈区。用户自由分配使用的空间统一放在堆区,便于管理。

  • 0
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值