地址空间(Address Space)
1. Generals
每个运行的目标程序都有自己的逻辑地址空间。编译器、操作系统与目标机共同管理和组织该逻辑地址空间。
操作系统将逻辑地址映射为物理地址,而物理地址对整个内存空间编址。另一方面,数据对象的存储布局受目标机的寻址约束的影响很大。比如很多机器执行整数加法的指令可能要求整数是四字节对齐的。此时编译器为了对齐可能会做padding(补白),使得实际分配的内存大于数据本身占用的内存。
2. Management of address space
一个典型的地址空间划分如下,
2.1 代码区
目标代码的大小在编译时刻就已经固定下来。编译器将可执行目标代码放在一个静态确定的区域:代码区。代码区通常位于存储的低端。
2.2 静态区
某些数据对象大小在编译时刻也是知道的,因此他们被放在静态区。静态区的数据对象包括全局变量和编译器产生的数据(如用于支持垃圾回收的信息等)
之所以将尽可能多的数据对象进行静态分配是因为这些对象的地址可以被编译到目标代码中。静态区的数据对象是静态分配的(对应于堆栈的动态分配)。
2.3 堆(heap)与栈(stack)
堆和栈放在剩余地址空间的相对两端,根据运行需要向对方增长。实践中,栈向较低地址的方向增长,堆向较高地址方向增长。
1)栈空间
一次过程(函数,过程,方法和子例程的统称)调用的局部变量在栈中分配空间
下图展示了一次活动记录(activation record,有时候也叫帧frame)中的各种类型的数据:
2) 堆空间
某些data生命周期要比被创造的某次过程调用要更长,通常被分配在堆空间。
典型的存储层次结构(memory hierarchy):
3. Reference
VAho A, SLam M, Sethi R, etal. 编译原理 Compilers: Principles, Techniques, and Tools[M]. 第二版. 机械工业出版社.