1. 基本概念
逻辑地址:每个逻辑地址由段和段内偏移组成。
线性地址:32位或64位的整数。
物理地址:内存芯片的编址。
2. 地址翻译
即将程序内使用的逻辑地址转换为线性地址,而后再转换成物理地址的过程。
在此翻译过程中,段单元用于将逻辑地址转化为线性地址;页单元将线性地址转换为物理地址。
在编写代码的过程中,需要指定特定的段寄存器,比如将代码段的值写入CS段寄存器中,将包含全局和静态变量的段的值写入DS段寄存器中。每个段都对应一个段描述符,用以描述段的属性,这些段描述符保存在LDT或者GDT中。
鉴于上述所述,将一个逻辑地址进行翻译的时候,首先确定该逻辑地址对应的段描述符所在的位置,即LDT or GDT,然后从GDT or LDT中取出该描述符,取出段地址,将该段地址加上逻辑地址中的段内偏移,得到逻辑地址对应的线性地址。
在LINUX中,主要使用四个段:__KERNEL_CS;__KERNEL_DS;__USER_CS;__USER_DS。这四个宏值代表对应的段选择器。
线性地址到物理地址的映射是通过页单元进行的,其中主要由页表完成,在初始化的时候配置页表,完成线性地址和物理地址映射。页的大小为4K,可以扩展为2M或者4M等。
在LINUX中,只有在内核才可以对页表进行建立、修改及删除操作。
对于32位的X86,通常划分0~3G的线性地址给用户空间使用,而高1G的地址给内核使用。在内核初始化的时候,将896M地址空间建立固定的映射。对于896M~4G的物理地址映射,使用动态映射的方式映射到128M的线性地址空间;当物理地址空间大于4G时,需要CPU地址线增加,INTEL使用PAE功能扩展物理地址位数为36位,而线性地址仍然为32位的。
除了上述的地址映射外,内核还提供了固定映射线性地址,即某个固定线性地址可以映射到任意的物理地址。此种类型的线性地址在4G线性地址空间的最后位置。
3. cache and TLB
TLB:加快线性地址到物理地址的映射。对某个线性地址第一次映射的时候,从内存中的页表将该线性地址翻译成对应的物理地址,而后将这个物理地址存在TLB中,当对同一个线性地址进行访问时,可以通过TLB,更快地得到对应的物理地址。
cache: 缓存某个内存单元的内容。有write-through 和 write-back两种回写内存方式。
由于cache和TLB的存在,则需要保证cache和TLB的有效性,比如在进程切换的时候,由于不同进程使用的页表不同,因而TLB需要更新。
另一个比较有意思的是:为了提供效率,需要把一个结构体中经常被访问的字段放在结构体开始的几个字段。
4. 总结
在了解了不同地址(在linux中,基本是线性地址和物理地址)之间的关系后,之后涉及到的内存管理,基本是对两种地址的管理、分配、回收。