本文转自: Linux分页管理机制
直接通过程序来分析:
#include<stdio.h>
voidtest(void){
printf("%s\n","Hello");
}
int main(int argc,char *argv[])
{
test();
return 0;
}
下面来看看地址的转移过程 ,gcc编译后对a.out 进行objdump反汇编结果如下(删除一部分汇编代码):
00000000004004c4<test>:
4004c4: 55 push %rbp
4004c5: 48 89 e5 mov %rsp,%rbp
4004c8: bf e8 05 40 00 mov $0x4005e8,%edi
4004cd: e8 e6 fe ff ff callq 4003b8 <puts@plt>
4004d2: c9 leaveq
4004d3: c3 retq
00000000004004d4<main>:
4004d4: 55 push %rbp
4004d5: 48 89 e5 mov %rsp,%rbp
4004d8: 48 83 ec 10 sub $0x10,%rsp
4004dc: 89 7d fc mov %edi,-0x4(%rbp)
4004df: 48 89 75 f0 mov %rsi,-0x10(%rbp)
4004e3: e8 dc ff ff ff callq 4004c4 <test>
4004e8: b8 00 00 00 00 mov $0x0,%eax
4004ed: c9 leaveq
4004ee: c3 retq
4004ef: 90 nop
左边的地址是虚拟地址,这里涉及到几个概念:
1.物理内存空间:主板上的内存条所提供的内存空间就为物理地址空间
2.物理地址:每个内存单元的实际地址
3.虚拟地址空间:我们自己看到的内存空间(从汇编语言来看)
4.CR1:未定的控制寄存器
5.CR2:页故障线性地址寄存器
6:CR3:页目录基址寄存器,保存页目录的物理地址
继续上面的内容:
分配给test()这个函数的起始地址为 :
00000000004004c4
Linux中最常见的可执行文件的格式为ELF(Executable andLinkable Format) .在ELF格式的可执行代码中,ld总是从地址0x8000000 开始安排程序的"代码段" 对每个程序都这样,至于程序执行时在物理内存中的实际地址,则在内核为其建立内存映射时临时分配, 具体地址取决于当时所分配的物理内存页面.
假设CPU开始执行main()函数中的:
4004e3: e8 dc ffff ff callq 4004c4 <test>
于是转移到虚拟地址4004c4 ,Linux内核设计的段式映射机制把这个地址原封不动的映射为线性地址,接着就进入页式映射过程.
每当调度程序选择一个进程来运行时,内核就要为即将运行的进程设置好控制寄存器CR3,而MMU的硬件总是从CR3中取得指向当前页目录的指针.
当程序转移到地址4004c4的时候,进程正在运行中,CR3指向进程的页目录.根据线性地址4004c4最高10位,就可以找到相应的目录项,把4004c4按二进制展开:
0000 0000 001000000 0000 0100 1100 0100
最高10位0000 0000 00即10进制0 ,于是以0为下标在页目录中找到其目录项,这个目录项中的高20位指向一个页表,CPU在这20位后填12个0后就得到该页表的物理地址.
找到页表后,CPU再来找线性地址的中间10位为1000000 000,10进制为512,从CPU以512为下标在页表中找到相应的页表项,取出其高20位,假如为0x356,然后与线性地址的最低12位0x4c4拼接起来就得到test()函数的入口物理地址0x3564c4,test()的执行代码就存储在这里.