《深入理解计算机系统》链接之符号表

1 篇文章 0 订阅
1 篇文章 0 订阅
 

你的变量究竟存储在什么地方?

分类: C/C++/VC   7204人阅读  评论(4)  收藏  举报
 你的变量究竟存储在什么地方?
作者:杨小华
       我相信大家都有过这样的经历,在面试过程中,考官通常会给你一道题目,然后问你某个变量存储在什么地方,在内存中是如何存储的等等一系列问题。不仅仅是在面试中,学校里面的考试也会碰到同样的问题。
       如果你还不知道答案,请接着往下看。接下来,我们将在Linux操作系统上,以GCC编译器为例来讲解变量的存储。
       在计算机系统中,目标文件通常有三种形式:
1.          可重定位的目标文件:包含二进制代码和数据,与其他可重定位目标文件合并起来,创建一个可执行目标文件。
2.          可执行的目标文件:包含二进制代码和数据,其形式可以被直接拷贝到存储器中并执行
3.          共享目标文件:一种特殊的可重定位目标文件,即我们通常所说的动(静)态链接库
一个典型的可重定位目标文件如下图所示:
                                                               高地址
节头部表
.strtab
.line
.debug
.rel.data
.rel.text
.symtab
.bss
        .data (3)
.rodata
        .text (1)
ELF头
                                                                        0
图 1典型的ELF可重定位目标文件(数字代表索引)
       夹在ELF头和节头部表之间的都是节(section),各个节的意思如下:
含义
.text
已编译程序的机器代码
.rodata
只读数据,如pintf和switch语句中的字符串和常量值
.data
已初始化的全局变量
.bss
未初始化的全局变量
.symtab
符号表,存放在程序中被定义和引用的函数和全局变量的信息
.rel.text
当链接器吧这个目标文件和其他文件结合时,.text节中的信息需修改
.rel.data
被模块定义和引用的任何全局变量的信息
.debug
一个调试符号表。
.line
原始C程序的行号和.text节中机器指令之间的映射
.strtab
一个字符串表,其内容包含.systab和.debug节中的符号表
       对于static类型的变量,gcc编译器在.data和.bss中为每个定义分配空间,并在.symtab节中创建一个有唯一名字的本地链接器符号。对于malloc而来的变量存储在堆(heap)中,局部变量都存储在栈(stack)中。
       下面我们以实际的例子来分析变量的存储:
#include<stdio.h>
#include<string.h>
#include<stdlib.h>
 
int z = 9;
int a;
static int b =10;
static int c;
void swap(int* x,int* y)
{
int temp;
temp=*x;
*x=*y;
*y=temp;
}  
 
int main()
{
int x=4,y=5;
swap(&x,&y);
printf(“x=%d,y=%d,z=%d,w=%d/n”,x,y,z,b);
return 0;
}   
       根据以上题目和理论知识,我们可以推断出:
变量
存储区域
a
.bss
b
.data
c
.bss
x
stack
y
stack
temp
stack
z
.data
swap
.text
main
.text
x=……
.rodata
       我们将从汇编代码和符号表中来分析以上答案是否正确。我们首先来看该程序的汇编代码:
        .file "var.c"
.globl z
       .data     #数据段
       .align 4
       .type       z, @object
       .size z, 4
z:
       .long       9
       .align 4
       .type       b, @object
       .size b, 4
b:
       .long       10
       .text     #代码段
.globl swap
       .type       swap, @function
swap:
       pushl       %ebp
       movl       %esp, %ebp
       subl $4, %esp
       movl       8(%ebp), %eax
       movl       (%eax), %eax
       movl       %eax, -4(%ebp)
       movl       8(%ebp), %edx
       movl       12(%ebp), %eax
       movl       (%eax), %eax
       movl       %eax, (%edx)
       movl       12(%ebp), %edx
       movl       -4(%ebp), %eax
       movl       %eax, (%edx)
       leave
       ret
       .size swap, .-swap
       .section   .rodata     #只读段
.LC0:
       .string     "x=%d,y=%d,z=%d,w=%d/n"
       .text           #代码段
.globl main
       .type       main, @function
main:
       pushl       %ebp
       movl       %esp, %ebp
       subl $40, %esp
       andl $-16, %esp
       movl       $0, %eax
       subl %eax, %esp
       movl       $4, -4(%ebp)
       movl       $5, -8(%ebp)
       leal   -8(%ebp), %eax
       movl       %eax, 4(%esp)
       leal   -4(%ebp), %eax
       movl       %eax, (%esp)
       call swap
       movl       b, %eax
       movl       %eax, 16(%esp)
       movl       z, %eax
       movl       %eax, 12(%esp)
       movl       -8(%ebp), %eax
       movl       %eax, 8(%esp)
       movl       -4(%ebp), %eax
       movl       %eax, 4(%esp)
       movl       $.LC0, (%esp)
       call printf
       movl       $0, %eax
       leave
       ret
       .size main, .-main
       .comm    a,4,4
       .local       c
       .comm    c,4,4
       .section   .note.GNU-stack,"",@progbits
       .ident      "GCC: (GNU) 3.3.5 (Debian 1:3.3.5-13)"
       通过以上汇编代码可以发现,z和b在.data段,main和swap在.text段,a和c在.bss段,x,y,temp在stack中,printf函数所打印的字符串在.rodata中。
       下面我们在通过符号表来解释变量的存储。
       每个可重定位目标文件都有一个符号表,它包含该文件所定义和引用的符号的信息。在链接器的上下文中,有三种不同的符号:
1.          由该文件定义并能被其他模块引用的全局符号。即非静态的C函数和非静态的全局变量,如程序中的a,z,swap。
2.          由其他模块定义并被该文件引用的全局符号。用extern关键字所定义的变量和函数。
3.          只被该文件定义和引用的本地符号。用static关键字定义的函数和变量。如程序中的b和c。
该程序所对应的符号表如图所示:
图 2符号表
首先,我们解释上图中各字段的含义:
字段名
含义
Num
序号
Value
符号地址。
可重定位目标文件:距定义目标文件的节的起始位置的偏移
可执行目标文件:一个绝对运行的地址
Size
目标的大小
Type
要么是数据,要么是函数,或各个节的表目
Bind
符号是全局的还是本地的
Vis
目前还没有查到资料,待以后改正
Ndx
通过索引来表示每个节
ABS:不该被重定位的符号
UND:代表未定义的符号(在其他地方定义)
COM:未初始化的数据目标
Name
指向符号的名字
       对于变量b和z,Ndx索引为3,我们观察图1,不难发现索引3对应的是.data段。变量c对应的索引为4(.bss段),变量a对应的索引是COM,最终当该程序被链接时,它将做为一个.bss目标分配。我们从反汇编代码中,对于变量a和c都是.comm(反汇编代码中以“.”开头的行,是指导汇编器和链接器运行的命令):
        ……
       .comm    a,4,4
       .local       c
       .comm    c,4,4
       ……
注意:a所对应的Bind为GLOBAL,即为全局变量,虽然变量c也在.bss段中,但Bind却是LOCAL,则为本地变量。.data段中的变量b和c也是类似的情况。swap和main都在索引1所对应的.text段中。由于printf是在库中所定义的,所以索引为UND。
       符号表中不包含对应于 本地非静态程序变量中的任何符号。这些符号是在栈中被管理的,所以符号表中没有出现x,y,temp符号。
       相信大家读完这篇文章以后,再也用不着对类似的题目胆战心惊了。

本文来自CSDN博客,转载请标明出处:http://blog.csdn.net/normalnotebook/archive/2006/06/08/781397.aspx

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
深入理解计算机系统》的目录如下: 第一部分 计算机系统漫游 第 1 章 计算机系统漫游 1.1 信息就是位+上下文 1.2 程序被其他程序翻译成不同的格式 1.3 了解编译系统如何工作是大有益处的 1.4 处理器读并解释存储在内存中的指令 1.5 系统中的 I/O 操作会以编程方式访问硬件 1.6 系统之间利用网络进行通信 第二部分 程序结构与执行 第 2 章 信息的表示和处理 2.1 信息存储 2.2 整数表示 2.3 整数运算 2.4 浮点数 2.5 代码优化 第 3 章 程序的机器级表示 3.1 程序编码 3.2 访问信息 3.3 操作系统管理信息的方式 3.4 异常控制流 3.5 虚拟内存 3.6 内存管理 第三部分 系统级 I/O 第 4 章 处理器体系结构 4.1 处理器组成 4.2 指令执行和处理器性能 4.3 流水线处理器 4.4 处理器调度 4.5 多处理器系统 第 5 章 存储器层次结构 5.1 存储器技术 5.2 存储器层次结构 5.3 缓存性能优化 5.4 虚拟存储器 第 6 章 系统级 I/O 6.1 通信原理 6.2 I/O 设备 6.3 客户端-服务器模型 6.4 网络编程 6.5 并发编程 第四部分 网络编程 第 7 章 链接 7.1 静态链接 7.2 目标文件 7.3 动态链接 7.4 重定位 第 8 章 异常控制流 8.1 异常 8.2 进程 8.3 信号 8.4 异常控制流在 UNIX 系统中的实现 第 9 章 虚拟内存 9.1 地址空间 9.2 页表 9.3 页面置换算法 9.4 高级虚拟内存技术 第五部分 存储器层次结构 第 10 章 系统级 I/O 的例子:以 Linux 为例 10.1 Linux I/O 简介 10.2 操作系统支持的 I/O 设备 10.3 I/O 设备编程 10.4 总线、I/O 设备和驱动程序之间的交互 10.5 系统级 I/O 软件的架构 第 11 章 系统级 I/O 的例子:以 Windows 为例 11.1 Windows I/O 简介 11.2 操作系统支持的 I/O 设备 11.3 I/O 设备编程 11.4 总线、I/O 设备和驱动程序之间的交互 11.5 系统级 I/O 软件的架构 附录A ASCII 码表 附录B 编译器和库函数 附录C x86 指令集简介 附录D 常用的 C 库函数 附录E 无符号加法的实现 附录F 数组乘法的实现 附录G 格式化输出的实现 附录H Makefile 的基础知识和技巧 附录I 延伸阅读 附录J 题解

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值