映射完整物理地址

刚才我们看到,页表中映射了内核代码区域。那如果内核要访问其他的区域呢?内核又能够访问多大的内存空间呢?现在我们就去探索一下。

找到代码

据我所知,相关的秘密就在这个函数之中了。

    /* the ISA range is always mapped regardless of memory holes */
    init_memory_mapping(0, ISA_END_ADDRESS);

    ...

    /*
     * If the allocation is in bottom-up direction, we setup direct mapping
     * in bottom-up, otherwise we setup direct mapping in top-down.
     */
    if (memblock_bottom_up()) {
        unsigned long kernel_end = __pa_symbol(_end);

        /*
         * we need two separate calls here. This is because we want to
         * allocate page tables above the kernel. So we first map
         * [kernel_end, end) to make memory above the kernel be mapped
         * as soon as possible. And then use page tables allocated above
         * the kernel to map [ISA_END_ADDRESS, kernel_end).
         */
        memory_map_bottom_up(kernel_end, end);
        memory_map_bottom_up(ISA_END_ADDRESS, kernel_end);
    } else {
        memory_map_top_down(ISA_END_ADDRESS, end);
    }

上面这两个函数都最后调用kernel_physical_mapping_init()来实际把映射关系写入了页表。

做个实验

具体代码分析就不在这看了。做个小实验,看一下映射后的效果。

diff --git a/arch/x86/mm/init.c b/arch/x86/mm/init.c
index 22af912..b3f0d27 100644
--- a/arch/x86/mm/init.c
+++ b/arch/x86/mm/init.c
@@ -589,6 +589,14 @@ static void __init memory_map_bottom_up(unsigned long map_start,
 void __init init_mem_mapping(void)
 {
    unsigned long end;
+   int i, j;
+   pud_t *pud;
+
+   pr_err(": init_level3_pgt = %lx\n", __pa_symbol(level3_kernel_pgt));
+   for (i = 0; i < 512; i++)
+       if (pgd_val(init_level4_pgt[i]))
+           pr_err(": init_level4_pgt[%d] 0x%lx\n",
+               i, pgd_val(init_level4_pgt[i]));

    probe_page_size_mask();

@@ -624,6 +632,21 @@ void __init init_mem_mapping(void)
        memory_map_top_down(ISA_END_ADDRESS, end);
    }

+   pr_err(": after memory mapped\n");
+   for (i = 0; i < 512; i++) {
+       if (pgd_val(init_level4_pgt[i])) {
+           pr_err(": init_level4_pgt[%d] 0x%lx\n",
+               i, pgd_val(init_level4_pgt[i]));
+
+           pud = (pud_t *)pgd_page_vaddr(init_level4_pgt[i]);
+
+           for(j = 0; j < 512; j++)
+               if (pud_val(pud[j]))
+                   pr_err(": \t pud[%d] = %lx\n",
+                       j, pud_val(pud[j]));
+       }
+   }
+
 #ifdef CONFIG_X86_64
    if (max_pfn > max_low_pfn) {
        /* can we preseve max_low_pfn ?*/

该代码就是打印了两层的页表,显示的是物理地址。实验的结果是:

[    0.000000] : init_level3_pgt = 1e0a000
[    0.000000] : init_level4_pgt[511] 0x1e0a067
[    0.000000] : after memory mapped
[    0.000000] : init_level4_pgt[272] 0x2230067
[    0.000000] :     pud[0] = 2231067
[    0.000000] :     pud[1] = 11ffff067
[    0.000000] :     pud[2] = 11fffe067
[    0.000000] :     pud[3] = 11fffd067
[    0.000000] :     pud[4] = 2233067
[    0.000000] : init_level4_pgt[511] 0x1e0a067
[    0.000000] :     pud[510] = 1e0b063
[    0.000000] :     pud[511] = 1e0c067

首先我们验证了init_level4_pgt的最后一项确实是init_level3_pgt。其次我们看到,映射前后页表的差异。映射后多了第272项,一共有五个表项。

增加内存

刚才虚拟机配置的内存是4G,现在我们配置成6G看看。

[    0.000000] : after memory mapped
[    0.000000] : init_level4_pgt[272] 0x2230067
[    0.000000] :     pud[0] = 2231067
[    0.000000] :     pud[1] = 1bcfff067
[    0.000000] :     pud[2] = 1bcffe067
[    0.000000] :     pud[3] = 1bcffd067
[    0.000000] :     pud[4] = 2234067
[    0.000000] :     pud[5] = 2235067
[    0.000000] :     pud[6] = 2233067
[    0.000000] : init_level4_pgt[511] 0x1e0a067
[    0.000000] :     pud[510] = 1e0b063
[    0.000000] :     pud[511] = 1e0c067

怎么样,是不是多了两项?

对了,现在配置的页表,每个pud映射的是1G,所以你增加了2G就增加了两个表项了。

嗯,我知道你在问为什么原来4G的时候是5个而不是4个表项? 你猜?

映射关系

和之前一样,我们再来计算一下页表的映射关系。

    (272) << 39 | (0) << 30
=   8800 0000 0000

这说明了虚拟地址0xFFFF 8800 0000 0000和物理地址0x0是对应的。

再来看一下这个定义

/*
 * Set __PAGE_OFFSET to the most negative possible address +
 * PGDIR_SIZE*16 (pgd slot 272).  The gap is to allow a space for a
 * hypervisor to fit.  Choosing 16 slots here is arbitrary, but it's
 * what Xen requires.
 */
#define __PAGE_OFFSET_BASE      _AC(0xffff880000000000, UL)

#define __PAGE_OFFSET           __PAGE_OFFSET_BASE

有了这两个概念再来物理地址转换虚拟地址的函数

#define __va(x)         ((void *)((unsigned long)(x)+PAGE_OFFSET))

怎么样,是不是这下能看懂了?当然了,代码中本来就是这么写的。我只是把结果先展示给大家,再来反推。

不是如来

想当年齐天大圣一个跟斗十万八千里都没有跳出如来佛祖的掌心,所以我也不知道佛祖他的手掌究竟是有多大。不过我们的页表覆盖的内存大小倒是有限制的。

首先地址空间是有限的,现在地址是用64bit表示,所以怎么着也不会超过这个范围。

其次我们在64bit中之用了48bit,至少从4.9的内核看是这样的。

然后我们在看,__PAGE_OFFSET的定义,一下子又把2^48劈成了两半,剩下的还不到一半了。

之前我就在想,那超过了怎么办,会不会把内核的映射空间给冲掉?后来发现自己想多了,人有这么一个定义

# define max_physmem_bits   46

也就是最大只能是2^46物理内存,所以这剩下来的小于2^47空间还是够的~

思考:这个变量是在哪里被使用到从而保证不超过2^46大小?

其实呢,内核中还有一个描述内存布局的文档可以证明这一点。Documentation/x86/x86_64/mm.txt

Virtual memory map with 4 level page tables:

0000000000000000 - 00007fffffffffff (=47 bits) user space, different per mm
hole caused by [48:63] sign extension
ffff800000000000 - ffff87ffffffffff (=43 bits) guard hole, reserved for hypervisor
ffff880000000000 - ffffc7ffffffffff (=64 TB) direct mapping of all phys. memory
ffffc80000000000 - ffffc8ffffffffff (=40 bits) hole
ffffc90000000000 - ffffe8ffffffffff (=45 bits) vmalloc/ioremap space
ffffe90000000000 - ffffe9ffffffffff (=40 bits) hole
ffffea0000000000 - ffffeaffffffffff (=40 bits) virtual memory map (1TB)
... unused hole ...
ffffec0000000000 - fffffbffffffffff (=44 bits) kasan shadow memory (16TB)
... unused hole ...
ffffff0000000000 - ffffff7fffffffff (=39 bits) %esp fixup stacks
... unused hole ...
ffffffef00000000 - fffffffeffffffff (=64 GB) EFI region mapping space
... unused hole ...
ffffffff80000000 - ffffffff9fffffff (=512 MB)  kernel text mapping, from phys 0
ffffffffa0000000 - ffffffffff5fffff (=1526 MB) module mapping space
ffffffffff600000 - ffffffffffdfffff (=8 MB) vsyscalls
ffffffffffe00000 - ffffffffffffffff (=2 MB) unused hole

虽然其中还有不少不是很了解,不过可以看到中间有一块64 TB的空间用来直接映射物理内存。而64 TB == 2^ 46。这就是linux内核在64位上现在能够映射的最大物理内存空间了。

PS:感觉快不够用了啊

页表容貌

来看看映射完物理地址后的页表吧。

这里写图片描述

细心的朋友可能已经注意到了,这次改写的是init_level4_pgt,而不是之前的early_level4_pgt了。

好,可以休息一下了~

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
在 Linux 中,可以使用 mmap() 系统调用将文件或设备映射到进程的虚拟地址空间,也可以将物理地址映射到进程的虚拟地址空间。要将物理地址 0x860000000 映射到进程的虚拟地址空间,可以执行以下步骤: 1. 打开 /dev/mem 设备文件,这个文件提供了对系统物理内存的访问。 2. 使用 mmap() 系统调用将物理地址 0x860000000 映射到进程的虚拟地址空间中,可以使用如下代码: ```c #define MAP_SIZE 4096UL #define MAP_MASK (MAP_SIZE - 1) off_t physical_address = 0x860000000; int fd = open("/dev/mem", O_RDWR | O_SYNC); void *map_base = mmap(NULL, MAP_SIZE, PROT_READ | PROT_WRITE, MAP_SHARED, fd, physical_address & ~MAP_MASK); ``` 这段代码使用了 MAP_SHARED 标志,表示多个进程可以共享这个映射区域。映射区域的大小为 MAP_SIZE,这里设置为 4096 字节,也就是一个页的大小。MAP_MASK 宏用于掩码,将物理地址的低 12 位清零,因为一个页的大小通常是 4KB,即低 12 位都是 0。 3. 映射成功后,可以通过指针对映射区域进行读操作,如下所示: ```c volatile uint32_t *mapped_device = (volatile uint32_t *) (map_base + (physical_address & MAP_MASK)); uint32_t value = *mapped_device; *mapped_device = 0x12345678; ``` 这里将映射区域的起始地址加上物理地址的低 12 位,得到了物理地址对应的虚拟地址。用指针指向这个虚拟地址就可以进行读操作了。注意,这里使用了 volatile 关键字,用于告诉编译器不要对指针所指向的内存进行优化,以保证操作的原子性和可见性。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值