你的变量究竟存储在什么地方?

本文通过一个具体例子详细解析了不同类型的变量如何在Linux环境下被存储,包括静态变量、局部变量及函数等在内存中的分布情况。
 你的变量究竟存储在什么地方?
作者:杨小华
       我相信大家都有过这样的经历,在面试过程中,考官通常会给你一道题目,然后问你某个变量存储在什么地方,在内存中是如何存储的等等一系列问题。不仅仅是在面试中,学校里面的考试也会碰到同样的问题。
       如果你还不知道答案,请接着往下看。接下来,我们将在Linux操作系统上,以GCC编译器为例来讲解变量的存储。
       在计算机系统中,目标文件通常有三种形式:
1.         可重定位的目标文件:包含二进制代码和数据,与其他可重定位目标文件合并起来,创建一个可执行目标文件。
2.         可执行的目标文件:包含二进制代码和数据,其形式可以被直接拷贝到存储器中并执行
3.         共享目标文件:一种特殊的可重定位目标文件,即我们通常所说的动(静)态链接库
一个典型的可重定位目标文件如下图所示:
                                                               高地址
节头部表
.strtab
.line
.debug
.rel.data
.rel.text
.symtab
.bss
        .data (3)
.rodata
        .text (1)
ELF头
                                                                        0
图 1典型的ELF可重定位目标文件(数字代表索引)
       夹在ELF头和节头部表之间的都是节(section),各个节的意思如下:
含义
.text
已编译程序的机器代码
.rodata
只读数据,如pintf和switch语句中的字符串和常量值
.data
已初始化的全局变量
.bss
未初始化的全局变量
.symtab
符号表,存放在程序中被定义和引用的函数和全局变量的信息
.rel.text
当链接器吧这个目标文件和其他文件结合时,.text节中的信息需修改
.rel.data
被模块定义和引用的任何全局变量的信息
.debug
一个调试符号表。
.line
原始C程序的行号和.text节中机器指令之间的映射
.strtab
一个字符串表,其内容包含.systab和.debug节中的符号表
       对于static类型的变量,gcc编译器在.data和.bss中为每个定义分配空间,并在.symtab节中创建一个有唯一名字的本地链接器符号。对于malloc而来的变量存储在堆(heap)中,局部变量都存储在栈(stack)中。
       下面我们以实际的例子来分析变量的存储:
#include<stdio.h>
#include<string.h>
#include<stdlib.h>
 
int z = 9;
int a;
static int b =10;
static int c;
void swap(int* x,int* y)
{
int temp;
temp=*x;
*x=*y;
*y=temp;
}  
 
int main()
{
int x=4,y=5;
swap(&x,&y);
printf(“x=%d,y=%d,z=%d,w=%d/n”,x,y,z,b);
return 0;
}   
       根据以上题目和理论知识,我们可以推断出:
变量
存储区域
a
.bss
b
.data
c
.bss
x
stack
y
stack
temp
stack
z
.data
swap
.text
main
.text
x=……
.rodata
       我们将从汇编代码和符号表中来分析以上答案是否正确。我们首先来看该程序的汇编代码:
       .file "var.c"
.globl z
       .data     #数据段
       .align 4
       .type       z, @object
       .size z, 4
z:
       .long       9
       .align 4
       .type       b, @object
       .size b, 4
b:
       .long       10
       .text     #代码段
.globl swap
       .type       swap, @function
swap:
       pushl       %ebp
       movl       %esp, %ebp
       subl $4, %esp
       movl       8(%ebp), %eax
       movl       (%eax), %eax
       movl       %eax, -4(%ebp)
       movl       8(%ebp), %edx
       movl       12(%ebp), %eax
       movl       (%eax), %eax
       movl       %eax, (%edx)
       movl       12(%ebp), %edx
       movl       -4(%ebp), %eax
       movl       %eax, (%edx)
       leave
       ret
       .size swap, .-swap
       .section   .rodata     #只读段
.LC0:
       .string     "x=%d,y=%d,z=%d,w=%d/n"
       .text           #代码段
.globl main
       .type       main, @function
main:
       pushl       %ebp
       movl       %esp, %ebp
       subl $40, %esp
       andl $-16, %esp
       movl       $0, %eax
       subl %eax, %esp
       movl       $4, -4(%ebp)
       movl       $5, -8(%ebp)
       leal   -8(%ebp), %eax
       movl       %eax, 4(%esp)
       leal   -4(%ebp), %eax
       movl       %eax, (%esp)
       call swap
       movl       b, %eax
       movl       %eax, 16(%esp)
       movl       z, %eax
       movl       %eax, 12(%esp)
       movl       -8(%ebp), %eax
       movl       %eax, 8(%esp)
       movl       -4(%ebp), %eax
       movl       %eax, 4(%esp)
       movl       $.LC0, (%esp)
       call printf
       movl       $0, %eax
       leave
       ret
       .size main, .-main
       .comm    a,4,4
       .local       c
       .comm    c,4,4
       .section   .note.GNU-stack,"",@progbits
       .ident      "GCC: (GNU) 3.3.5 (Debian 1:3.3.5-13)"
       通过以上汇编代码可以发现,z和b在.data段,main和swap在.text段,a和c在.bss段,x,y,temp在stack中,printf函数所打印的字符串在.rodata中。
       下面我们在通过符号表来解释变量的存储。
       每个可重定位目标文件都有一个符号表,它包含该文件所定义和引用的符号的信息。在链接器的上下文中,有三种不同的符号:
1.         由该文件定义并能被其他模块引用的全局符号。即非静态的C函数和非静态的全局变量,如程序中的a,z,swap。
2.         由其他模块定义并被该文件引用的全局符号。用extern关键字所定义的变量和函数。
3.         只被该文件定义和引用的本地符号。用static关键字定义的函数和变量。如程序中的b和c。
该程序所对应的符号表如图所示:
图 2符号表
首先,我们解释上图中各字段的含义:
字段名
含义
Num
序号
Value
符号地址。
可重定位目标文件:距定义目标文件的节的起始位置的偏移
可执行目标文件:一个绝对运行的地址
Size
目标的大小
Type
要么是数据,要么是函数,或各个节的表目
Bind
符号是全局的还是本地的
Vis
目前还没有查到资料,待以后改正
Ndx
通过索引来表示每个节
ABS:不该被重定位的符号
UND:代表未定义的符号(在其他地方定义)
COM:未初始化的数据目标
Name
指向符号的名字
       对于变量b和z,Ndx索引为3,我们观察图1,不难发现索引3对应的是.data段。变量c对应的索引为4(.bss段),变量a对应的索引是COM,最终当该程序被链接时,它将做为一个.bss目标分配。我们从反汇编代码中,对于变量a和c都是.comm(反汇编代码中以“.”开头的行,是指导汇编器和链接器运行的命令):
        ……
       .comm    a,4,4
       .local       c
       .comm    c,4,4
       ……
注意:a所对应的Bind为GLOBAL,即为全局变量,虽然变量c也在.bss段中,但Bind却是LOCAL,则为本地变量。.data段中的变量b和c也是类似的情况。swap和main都在索引1所对应的.text段中。由于printf是在库中所定义的,所以索引为UND。
       符号表中不包含对应于本地非静态程序变量中的任何符号。这些符号是在栈中被管理的,所以符号表中没有出现x,y,temp符号。
       相信大家读完这篇文章以后,再也用不着对类似的题目胆战心惊了。
### 变量在内存中的存储方式和位置 变量在程序运行时的存储位置取决于其类型、作用域和生命周期。在不同编程语言中,变量存储方式有所不同,但通常可以分为以下几种主要的存储区域: #### 栈(Stack) 栈是一种后进先出(LIFO)的数据结构,用于存储函数调用时的局部变量和函数参数。栈内存由编译器自动分配和释放,访问速度快,但容量有限。局部变量在进入其作用域时被分配到栈上,在离开作用域时自动释放。 例如,在C语言中,函数内部定义的变量会被存储在栈中: ```c #include <stdio.h> void exampleFunction() { int localVar = 10; // 局部变量存储在栈中 printf("%d\n", localVar); } int main() { exampleFunction(); return 0; } ``` #### 堆(Heap) 堆是一种动态分配的内存区域,用于存储程序运行时手动分配的对象或数据结构。堆内存的管理由程序员负责,通常使用 `malloc`(C)、`new`(C++)等操作符进行分配,使用 `free`(C)或 `delete`(C++)进行释放。堆的容量较大,但访问速度相对较慢,且容易引发内存泄漏。 例如,在C++中动态分配一个整数: ```cpp #include <iostream> int main() { int* heapVar = new int(20); // 堆上分配的变量 std::cout << *heapVar << std::endl; delete heapVar; // 手动释放堆内存 return 0; } ``` #### 静态存储区(Static Storage Area) 静态存储区用于存储全局变量和静态变量(如类的静态成员变量)。这些变量在程序启动时被分配内存,并在程序结束时释放。静态存储区的变量具有较长的生命周期,通常用于跨函数或跨模块共享数据。 在Java中,类变量(静态变量存储在方法区(在Java 8之后,方法区被元空间取代)中,而实例变量存储在堆中。例如: ```java class Value { public int num; // 实例变量存储在堆中 public static int staticNum; // 类变量存储在方法区中 } ``` #### 常量存储区(Constant Storage Area) 常量存储区用于存储程序中的常量数据,如字符串常量、`const`修饰的常量等。这些数据通常在编译时确定,并在程序运行期间保持不变。常量存储区的内存通常由操作系统保护,防止被修改。 例如,在C++中定义一个常量: ```cpp #include <iostream> int main() { const char* str = "Hello, World!"; // 字符串常量存储在常量存储区 std::cout << str << std::endl; return 0; } ``` #### 寄存器(Register) 寄存器是CPU内部的高速存储单元,用于存储频繁访问的数据。某些编译器会将局部变量优化为寄存器变量,以提高程序的执行效率。然而,寄存器的数量有限,因此并非所有变量都能被优化为寄存器变量。 在C语言中,可以使用 `register` 关键字建议编译器变量存储在寄存器中: ```c #include <stdio.h> int main() { register int i; // 建议编译器将i存储在寄存器中 for (i = 0; i < 10; i++) { printf("%d\n", i); } return 0; } ``` ### 总结 不同类型的变量在程序运行时的存储位置和方式各有不同。局部变量通常存储在栈中,动态分配的对象存储在堆中,全局变量和静态变量存储在静态存储区,常量数据存储在常量存储区,而频繁访问的变量可能被优化为寄存器变量。理解这些存储机制有助于编写高效、稳定的程序。
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值