多级页表如何节约内存

在学习计算机组成原理时,书中谈到,"使用多级页表可以压缩页表占用的内存",在了解了多级页表的原理后,恐怕对这句话还是理解不了:把页表换成多级页表了就能节约内存了?不是还是得映射所有的虚拟地址空间么?

比如做个简单的数学计算,假如虚拟地址空间为32位(即4GB)、每个页面映射4KB以及每条页表项占4B,则进程需要1M个页表项(4GB / 4KB = 1M),即页表(每个进程都有一个页表)占用4MB(1M * 4B = 4MB)的内存空间。而假如我们使用二级页表,还是上述条件,但一级页表映射4MB、二级页表映射4KB,则需要1K个一级页表项(4GB / 4MB = 1K)、每个一级页表项对应1K个二级页表项(4MB / 4KB = 1K),这样页表占用4.004MB(1K * 4B + 1K * 1K * 4B = 4.004MB)的内存空间。多级页表的内存空间占用反而变大了?

其实我们应该换个角度来看问题,还记得计算机组成原理里面无处不在的局部性原理么?

如何节约内存

我们分两方面来谈这个问题:第一,二级页表可以不存在;第二,二级页表可以不在主存。

二级页表可以不存在

我们反过来想,每个进程都有4GB的虚拟地址空间,而显然对于大多数程序来说,其使用到的空间远未达到4GB,何必去映射不可能用到的空间呢?

也就是说,一级页表覆盖了整个4GB虚拟地址空间,但如果某个一级页表的页表项没有被用到,也就不需要创建这个页表项对应的二级页表了,即可以在需要时才创建二级页表。做个简单的计算,假设只有20%的一级页表项被用到了,那么页表占用的内存空间就只有0.804MB(1K * 4B + 0.2 * 1K * 1K * 4B = 0.804MB),对比单级页表的4M是不是一个巨大的节约?

那么为什么不分级的页表就做不到这样节约内存呢?我们从页表的性质来看,保存在主存中的页表承担的职责是将虚拟地址翻译成物理地址;假如虚拟地址在页表中找不到对应的页表项,计算机系统就不能工作了。所以页表一定要覆盖全部虚拟地址空间,不分级的页表就需要有1M个页表项来映射,而二级页表则最少只需要1K个页表项(此时一级页表覆盖到了全部虚拟地址空间,二级页表在需要时创建)。

二级页表可以不在主存

其实这就像是把页表当成了页面。回顾一下请求分页存储管理,当需要用到某个页面时,将此页面从磁盘调入到内存;当内存中页面满了时,将内存中的页面调出到磁盘,这是利用到了程序运行的局部性原理。我们可以很自然发现,虚拟内存地址存在着局部性,那么负责映射虚拟内存地址的页表项当然也存在着局部性了!这样我们再来看二级页表,根据局部性原理,1024个第二级页表中,只会有很少的一部分在某一时刻正在使用,我们岂不是可以把二级页表都放在磁盘中,在需要时才调入到内存?我们考虑极端情况,只有一级页表在内存中,二级页表仅有一个在内存中,其余全在磁盘中(虽然这样效率非常低),则此时页表占用了8KB(1K * 4B + 1 * 1K * 4B = 8KB),对比上一步的0.804MB,占用空间又缩小了好多倍!

总结

我们把二级页表再推广到多级页表,就会发现页表占用的内存空间更少了,这一切都要归功于对局部性原理的充分应用。

回头想想,这么大幅度地解决内存空间,我们失去了什么呢?计算机的很多问题无外乎就是时间换空间和空间换时间了,而多级页表就是典型的时间换空间的例子了,动态创建二级页表、调入和调出二级页表都是需要花费额外时间的,远没有不分级的页表来的直接;而我们也仅仅是利用局部性原理让这个额外时间开销降得比较低了而已。

 

这里是自己的理解思路记录一下,防止下次又不会了

这里的地址 0x00403004 十进制 4206596 转为二进制 10000000011000000000100

按照多级页面的寻址规则将其分为三段 PT1 10位 PT2 10位 PT3 12位

0000000001 0000000011 000000000100 >>>>> PT1 = 1 PT2 = 3 PT3 = 4

这里的 PT1 = 1 说明 MMU 首先根据 1 作为索引访问顶级页表找到 1 号页表项,因为顶级页表的每一个页表项所指向的物理块(二级页表)包含 4M 的地址空间, 所以 1号页表项(第二个页表项) 对应的地址范围是 4M —8M 。

PT2 = 3 说明该地址在二级页表内的 3号页表项。由于二级页表每个页表项指向一个 4K 的物理块。

3号页表项 代表的它所在的 4M 块的 4K * 3 —— 4K * 4 - 1(因为块号是从 0 开始 , 第三号块 就是第4块) 4K * 3 —— 4K * 4 -1 就是 12288 —— 16383.

代表的地址范围就是 (也就是 第3号块的起始位置 到 第4号块起始位置减1)

顶级页面第一个页表项 二级页面第3号块 二级页页表项内的偏移量0 顶级页面第一个页表项 二级页面第4号块 二级页页表项内的偏移量0

0000000001 0000000011 000000000000 —— 0000000001 0000000100 000000000000

------------------------------------------------------           ------------------------------------------------------

                         4206592                                                            4210688

也就是代表的 绝对地址范围 4206592 到 4210688 - 1 正好包含 4206596

并且 4206596 也正好是二级页表项内的 第4号页表项(从4206592开始) 正好等于 PT3

  • 4
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值