RISCV 四级页表
一直以来,对linux中通过多级页表将虚拟地址转换为物理地址的方法不甚了解,正好借着riscv研究一下。
riscv特权文档中定义了Sv32、Sv39、Sv48和Sv57这么几种虚拟内存系统。顾名思义,Sv32表示地址长度为32位,Sv39则是39位。其中Sv32是用于32位系统的,Sv39、Sv48和Sv57则是用于64位系统。而Sv39、Sv48、Sv57分别也就对应三级页表,四级页表和五级页表。这里只讨论SV48的实现。目前最新的64位linux应该是支持了Sv39和Sv48两种格式。
页表的起始地址一般写在了satp寄存器当中,根据riscv特权文档可见,satp寄存器格式如下,其中mode域指明了采用哪种虚拟内存系统。如果是0则表示不使用虚拟地址。如果使用Sv48,则应将Mode设置位9,PPN指定了第一级页表存在的物理地址。
每一个页表的结构都是一样的,由512个页表项组成,每一个页表项结构都由下图所示。512个页表项正好由9位地址索引,所以每增加一级页表,地址都会增加9位。
根据Sv48页表项的结构来看,每一级的9位PPN则代表了其在该级页表的索引。
页表项中,V代表该页表是否有效,如果处理器在查找页表项是发现该页表项是无效页表,则应触发异常,X、W、R则表示该页表的访问权限,如果三者皆为0,则表示该页表存储的为下一级页表的指针。
U表示该页是否能由在U-mode权限下的处理器访问
G表示该页是否为全局页表
A表示从上一次A被清零后,是否发生了读取或者写入
D表示从上一次A被清零后,是否发生了写入
PPN则表示翻译后的地址或者是下一级页表的指针。
四级页表在使用过程中并不代表一定会进行四次翻译,根据页表结构,也可能只进行一次、两次、三次翻译。
如果进行了四次翻译,则物理地址等于PPN[3:0]<<12||V_ADDRESS[11:0]
如果进行了三次翻译,则物理地址等于PPN[3:1]<<21||V_ADDRESS[20:0]
如果进行了两次翻译,则物理地址等于PPN[3:2]<<30||V_ADDRESS[29:0]
如果进行了一次翻译,则物理地址等于PPN[3:3]<<39||V_ADDRESS[38:0]
具体的细节可以参考如下网址给出的图片
https://zhuanlan.zhihu.com/p/78444537