编写一个用户空间的程序,输出一个字符串的地址,然后通过crash工具找到这个虚拟地址对应的物理地址。
#include <stdlib.h>
#include <stdio.h>
#include <unistd.h>
int main(){
int i;
char * a="helloworld1234567";
printf("%p\n",a);
sleep(3600);
return 0;
}
编译运行,产生如下输出
说明字符串a的虚拟地址是0x402004。
运行crash工具,需要给出对应内核的vmlinux。
a.out对应的进程描述符的地址为0xffff96db74b08000,pid为1728
该进程对应的mm_struct的地址为0xffff96db6f53a400,其pgd地址为0xffff96db793b6000
这里使用的是4级页表,虚拟地址0x402004的
页内偏移为低12位,即:004
pte偏移位12-20位,即:2
pmd偏移为21-30,即:2
pud、pgd偏移位0
所以该虚拟地址对应的pud页表地址为0xb7402000,对于页目录项,其12-35位表示下一级页表的物理地址。
虚拟地址对应pmd页表地址为0xb9ea6000
虚拟地址对应pte页表地址为0xb9ea9000
虚拟地址对应pte的地址为0x800000008813e025
所以虚拟地址对应的物理地址为8813e004,可以看到其内容就是字符串"helloworld123456"。
以上这些步骤,在crash中都可以通过vtop命令完成,因为用户空间的地址特定于进程,所以要先通过set命令指定当前进程上下文。
这里有一个很有意思的点:该虚拟地址对应的page结构体的虚拟地址为0xffffe27f82204f80。它和物理地址8813e000有什么关系呢?
在sparse-vmemmap内存模型下,所有的page结构体连续存放于vmemmap-base开始的空间内,vmemmap-base会在内核初始化时设置为一个随机值,在本次测试环境中其值为0xffffe27f80000000,page的虚拟地址减去这个值再除以64(page结构体的大小)即所谓页帧号,页帧号再乘以4096就可以得到物理地址。
0xffffe27f82204f80 - 0xffffe27f80000000 = 0x2204f80 = 35,671,936。
35,671,936 / 64 *4096 = 2,283,003,904 =8813e000。
通过以上的分析,我们可以更清晰地看到,页表项、页目录项里存储的是下一级页表的物理地址和一些标志位信息。
当然上面的分析中有一个问题,我们是通过pgd的虚拟地址来读取内存的,而其它的pud、pmd、pte等都是通过物理地址来读取内存,pgd的虚拟地址对应的物理地址该怎么计算呢,很明显它是一个内核空间的虚拟地址,通过init_mm.pgd(即swapper_pg_dir)按照上面的方法可以找到物理地址,然后init_mm.pgd也是个虚拟地址,它的物理地址又怎么得到呢,内核中有这样的代码(这部分是和架构相关的)
init_mm.pgd=0xffffffff9ba0a000
按照上面代码中的计算方法,其物理地址为:0xffffffff9ba0a000-0xffffffff80000000+0x8e600000(phys_base) =0xaa00a000。
与使用vtop得到的物理地址相同