Linux:页表中PGD、PUD、PMD、TLB等概念介绍

1、PGD: Page Global Directory
       Linux系统中每个进程对应用户空间的pgd是不一样的,但是linux内核 的pgd是一样的。当创建一个新的进程时,都要为新进程创建一个新的页面目录PGD,并从内核的页面目录swapper_pg_dir中复制内核区间页面目录项至新建进程页面目录PGD的相应位置,具体过程如下:do_fork() --> copy_mm() --> mm_init() --> pgd_alloc() --> set_pgd_fast() --> get_pgd_slow() --> memcpy(&PGD + USER_PTRS_PER_PGD, swapper_pg_dir +USER_PTRS_PER_PGD, (PTRS_PER_PGD - USER_PTRS_PER_PGD) * sizeof(pgd_t))
         这样一来,每个进程的页面目录就分成了两部分,第一部分为“用户空间”,用来映射其整个进程空间(0x0000 0000-0xBFFF FFFF)即3G字节的虚拟地址;第二部分为“系统空间”,用来映射(0xC000 0000-0xFFFF FFFF)1G字节的虚拟地址。可以看出Linux系统中每个进程的页面目录的第二部分是相同的,所以从进程的角度来看,每个进程有4G字节的虚拟空间,较低的3G字节是自己的用户空间,最高的1G字节则为与所有进程以及内核共享的系统空间。每个进程有它自己的PGD( Page Global Directory),它是一个物理页,并包含一个pgd_t数组。
关键字:
             PTE:  页表项(page table entry)
             PGD(Page Global Directory)
             PUD(Page Upper Directory)
             PMD(Page Middle Directory)
             PT(Page Table)

PGD中包含若干PUD的地址,PUD中包含若干PMD的地址,PMD中又包含若干PT的地址。每一个页表项指向一个页框,页框就是真正的物理内存页。

2、TLB

        Translation lookaside buffer,即旁路转换缓冲,或称为页表缓冲;里面存放的是一些页表文件(虚拟地址到物理地址的转换表)。又称为快表技术。如果匹配到逻辑地址就可以迅速找到页框号(页框号可以理解为页表项),通过页框号与逻辑地址的后12位的偏移自合得到最终的物理地址。如果没在TLB中匹配到逻辑地址,就出现TLB不命中(TLB Misss),需要通过常规的页表查询。如果TLB足够大,那么这个转换就会变得迅速。但是事实是TLB的容量非常小,一般都是几十项到几百项不等。
       在有些的处理器架构中,为了提供效率,还将TLB进行分组,以X86架构为例,一般都分为以下四个组:
       第一组:缓存一般页表(4KB页面)的指令页表缓存(Instruction-TLB)
       第二组:缓存一般页表(4KB页面)的数据页表缓存(Data-TLB)
       第三组:缓存大尺寸页表(2MB/4M页B面)的指令页表缓存(Instruction-TLB)    
       第四组:缓存大尺寸页表(2MB/4MB页面)的数据页表缓存(Data-TLB)
       举一个例子:假设一个应用程序需要使用8KB的物理内存,如果使用常规页(4KB)并且使TLB总能命中,那么至少需要在TLB表中存放两个表项,在这种情况下,只要寻址的内容都在该内容页内,那么只要两个表项就足够了。如果该应用程序需要使用512个内容页也就是2MB大小,那么需要512个页表表项才能保证不会出现TLB不命中的情况。但是TLB容量有限,随着程序的变大或者使用内存的增加,那么势必会增加TLB的使用项,最后导致TLB出现不命中的情况。此时,大页的优势就显示出来了,如果使用2MB作为分页的基本单位,那么只需要一个页表项就可以保证不出现TLB不命中的情况;对于消耗内存以GB(2^30)为单位的大型程序,可以采用1GB为单位作为分页的基本单位,减少TLB不命中的情况。
 

Linux x64 ,虚拟地址空间是 2^48 (256 TB)。为了管理这么大的地址空间,Linux 使用了四级页表。 四级页表包含了四个级别的页表,每个页表的大小都是 512 个条目。每个条目的大小为 8 字节,因此一个页表的大小为 4 KB。因此,一个四级页表的大小为 4 KB * 512 * 512 * 512 * 512 = 256 TB。 在四级页表,虚拟地址被划分为五个部分:PGD(Page Global Directory)、PUD(Page Upper Directory)、PMD(Page Middle Directory)、PTE(Page Table Entry)和偏移量。 - PGDPGD 是最高级的页表,它包含了 512 个 PUD 条目。 - PUDPUD 包含了 512 个 PMD 条目。 - PMDPMD 包含了 512 个 PTE 条目。 - PTE:PTE 包含了物理页框号和一些标志。 - 偏移量:偏移量用于计算物理地址。 当 CPU 访问一个虚拟地址时,它首先使用 PGD 条目找到对应的 PUD 条目,然后使用 PUD 条目找到对应的 PMD 条目,依此类推。最后,CPU 使用 PTE 条目找到对应的物理页框号,并将虚拟地址的偏移量添加到物理页框号,得到物理地址。 Linux x64 页表是按需分配的。当进程第一次访问某个虚拟地址时,Linux 会分配一个物理页框,并将该页框映射到对应的虚拟地址。如果进程再次访问同一虚拟地址,则直接使用之前分配的物理页框。 这是 Linux x64 页表的基本原理。理解页表的工作原理对于理解 Linux 内核的内存管理非常重要。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值