代码段 数据段 BSS段 栈区堆区的区别?

再谈应用程序分段: 数据段、代码段、BSS段以及堆和栈

天星

​关注他

61 人赞同了该文章

分段本身就是一个比较复杂的内容,值得再专门写一遍文章介绍,本文再前文基础上再谈应用程序的分段


ELF 文件

逆向分析:ELF 文件组成32 赞同 · 1 评论文章

讲过 ELF 文件结构大致如下图:

我们知道 ELF 文件包含三种类型:可重定位文件(*.o)、可执行文件、以及共享库(share library)。

三种文件格式从结构上来说基本一致,只是具体到每一个结构不同。

代码段(.text)是可执行指令的集合;数据段(.data)和 BSS 段(.bss)是数据的集合,其中.data 表示已经初始化的数据,.bss 表示未初始化的数据。

从可执行程序的角度来说,如果一个数据未被初始化,就不需要为其分配空间,所以.data 和.bss 的区别就是 .bss 并不占用可执行文件的大小,仅仅记录需要用多少空间来存储这些未初始化的数据,而不分配实际空间。

2 应用程序的组成

2.1 组成

从汇编语言角度,一个程序分为:

  • 数据段
  • 堆栈段
  • 代码段
  • 扩展段

站在高级语言,如 C 语言,一个程序分为如下段(当然还有其他段,这里列举主要的段):

  • 代码段
  • 数据段
  • BSS 段

我们可以看到一个可执行程序至少包含:代码段 + 数据段 + BSS 段

一般情况下,一个可执行二进制程序(在 linux 下为一个进程单元),在存储时(没有加载到内存运行),至少拥有三个部分,分别是代码段(text)、数据段(data)、和BSS 段。

这三个部分一起组成了可执行程序(可能还有其他的段,和平台相关)

当应用程序运行时(运行态),此时需要另外两个域:堆和栈。正在运行的程序:代码段 + 数据段 + BSS 段 + 堆 + 栈

如图所示为可执行应用程序存储态运行态的结构对照图。一个正在运行的 C 程序占用的内存区域分为代码段、数据段(初始化数据)、BSS 段(未初始化数据)、堆和栈 5 部分

2.2 内存管理

在将应用程序加载到内存空间执行时,操作系统负责代码段、数据段和 BSS 段的加载,并在内存中为这些段分配空间。栈也由操作系统管理,不需要程序员显示的管理;堆段需要程序员自己管理,显示的申请和释放。

动态分配

在运行时执行动态分配。需要程序员显示管理,通过 malloc 申请,并且需要手动 free 掉,否则会造成内存泄漏。

静态分配

在编译时就已经决定好了分配多少 Text+Data+Bss+Stack(静态分配)。

静态分配的内存在进程结束后由系统释放(Text+Data),Stack 上的数据则在退出函数后立即被销毁。

3 各段说明

3.1 代码段

代码段在内存中被映射为只读。它是由编译器在编译链接时自动计算的。通常是用来存放程序执行的指令。代码段输入静态内存分配。

3.2 数据段

通常用来存放程序中已初始化的(非 0)全局变量和静态局部变量。数据段的起始位置由链接定位文件确认,大小在编译链接时自动分配。数据段属于静态内存分配

3.3 BSS 段

bss 是英文 Block by Symbol 的简称。通常用来存放程序中未初始化和初始化为 0的全局变量和静态变量的一块内存区域,在程序载入时由内核清零。数据段属于静态内存分配

3.4 堆

堆保存函数内部动态分配(malloc 或 new)的内存,是另外一种用来保存程序信息的数据结构。

堆是先进先出(FIFO)数据结构。堆的地址空间是向上增加,即当堆上保存的数据越多,堆的地址越高。动态内存分配

注意:堆内存需要程序员手动管理内存,通常适用于较大的内存分配,如频繁的分配较小的内存,容易导致内存碎片化。

3.5 栈

栈保存函数的局部变量(不包括 static 修饰的变量),参数以及返回值。是一种后进先出(LIFO)的数据结构。

在调用函数或过程后,系统会清除栈上保存的局部变量、函数调用信息及其他信息。

栈的另外一个重要特征是,它的地址空间 向下减少,即当栈上保存的数据越多,栈的地址越低。静态内存分配

注意,由于栈的空间通常比较小,一般 linux 程序只有几 M,故局部变量,函数入参应该避免出现超大栈内存使用,比如超大结构体,数组等,避免出现 stack overflow

4 总结

事实上,运行态严格来说不是真正的物理存储结构,而是linux 为每个进程虚拟的地址空间(32位 操作系统对进程而且是虚拟的4G地址空间)。如有错误,欢迎指正!

相关段总结如下。

段名存储属性内存分配
代码段
.text
存放可执行程序的指令,存储态和运行态都有静态
数据段
.data
存放已初始化(非零初始化的全局变量和静态局部变量)的数据,存储态和运行态都有静态
bss段
.bss
存放未初始化(未初始化或者0初始化的全局变量和静态局部变量)的数据,存储态和运行态都有静态

heap
动态分配内存,需要通过malloc手动申请,free手动释放,适合大块内存。容易造成内存泄漏和内存碎片。运行态才有。动态

stack
存放函数局部变量和参数以及返回值,函数返回后,由操作系统立即回收。栈空间不大,使用不当容易栈溢出。运行态才有静态
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值