最近在看arm linux 的mm部分,看的是2.6.8.1,芯片是INTEL PXA255,参考资料有arm linux演艺、《情景分析》等。一遍看下来只能说似懂非懂。这里有几个基础的问题,大家看看我的理解是否正确,另外还有一个小问题我没有理解。
arm 的mmu支持4K,16K,64K等几种页表和1M的段表(section),arm linux用的应该是4K(small page)页表和1M的section。
1M的段表地址比较简单,
[31:20] table index, 2048
[19:0] section index, 1M
4K页表的地址在ARM里是这样设置的:
[31:20] first-level table index,4096
[19:12] second-level table index,256
[11:0] page index
而在arm linux里PGD, PMD, PT的划分又如下:
[31:21] PGD, 2048
[20] PMD, 2
[19:12] PT, 512
但这里的PMD又形同虚设,因为PT一次总是操作相隔256的2的表项,高的为linux,低的为H/W
因此
PTRS_PER_PGD = 2048
PTRS_PER_PTE = 512
PERS_PE_PMD = 1
地址转换的时候,先找到PGD,这是存放在CP15 C2里面的,tssk->mm->pgd里存放每个任务的pgd。switch_mm的时候放入CP15 C2
cpu_switch_mm(next->pgd, next);
mcr p15, 0, r0, c2, c0, 0 @ load page table pointer, r0 = next->pgd
硬件根据CP15 C2的内容找到一个first-level descriptor table,也就是linux里的PGD,其高18位加上虚拟地址va的[31:20] (first-level table index),读取这个地址的内容(第一次读取内存),得到first-level descriptor。
如果first-level descriptor的最低2位是10,表示是section descriptor,则高12位加上va[19:0]就是物理地址。
如果first-level descriptor的最低2位是01,表示是Coarse page table descriptor,高22位(second-level table的地址)加上va[19:12](second-level table index),这个地址读到second-level descriptor(第二次读取内存),高20位加上va[11:0],就是最后的物理地址。
以上工作都是硬件自动完成的,arm linux 要做的,就是设置PGD表(first-level table)和页表(second-level table)。
比如内核的PGD,放在swapper_pg_dir数组的下标0项,同时保存在init_task->mm->pgd中。
但是看到分配页表的函数create_mapping,有个小问题。
static void __init create_mapping(struct map_desc *md)
{
...
while ((virt & 0xfffff || (virt + off) & 0xfffff) && length >= PAGE_SIZE) {
alloc_init_page(virt, virt + off, prot_l1, prot_pte);
virt += PAGE_SIZE;
length -= PAGE_SIZE;
}// 如果地址不是1M对齐的,则先给头上一部分分配页表,按页大小(4K)分配、填充页表
while (length >= (PGDIR_SIZE / 2)) {
alloc_init_section(virt, virt + off, prot_sect);
virt += (PGDIR_SIZE / 2);
length -= (PGDIR_SIZE / 2);
}// 这里的地址已经是1M对齐的了,设置PGD对应项,按1M分配、填充段表
while (length >= PAGE_SIZE) {
alloc_init_page(virt, virt + off, prot_l1, prot_pte);
virt += PAGE_SIZE;
length -= PAGE_SIZE;
}// 1M对齐剩下的尾巴,分配页表
...
}
这里都要设置descriptor的保护位,也就是没有被地址用到的那些位,表示一些状态属性。
alloc_init_section只需要段保护位prot_sect就可以了,这个没什么问题,比如我用的板子,
prot_sect = 0x42e
// 010000101110
// section descriptor
// cache and buffer
// domain = 1,kernel
// ap = 01, read/write
而alloc_init_page由于有first-level table 和 second-level table,需要两个保护位,分别是prot_l1, prot_pte
奇怪的是,代入的两个数值
prot_pte = 0x0
// 没有任何设置
prot_l1 = 0x20
// domain = 1,kernel
因为类型为MEMORY的存储设备,默认的prot_pte和prot_l1都是0。
虽然我用的PXA255开发板,地址是1M对齐的,且后面没有多余的地址,不需要前后两段分配页表(相信多数的处理器和开发板也是这样),但是既然有这样的代码,就应该赋给正确的值。
后面还有一段,映射中断向量表所在的区域
init_maps->physical = virt_to_phys(init_maps);
init_maps->virtual = vectors_base();
init_maps->length = PAGE_SIZE;
init_maps->type = MT_VECTORS;
create_mapping(init_maps);
这里面的保护位就没什么问题
prot_pte = 0xcb
// 11001011
// Extended small page base address
// cache not buffer
// read only?
// TEX = 11
prot_l1 = 0x1
// Coarse page table base address
// domain = 0, user
哪位研究过arm linux mm的朋友能解释一下?
下面是对上面用到的几个函数的展开分析。
static inline void
alloc_init_section(unsigned long virt, unsigned long phys, int prot)
{
pmd_t *pmdp;
pmdp = pmd_offset(pgd_offset_k(virt), virt);
// 展开为(pmd_t *)init_mm->pgd + (virt) >> 21, the high 11bit of va
// 得到虚拟地址virt 在 first-level table中的位置
if (virt & (1 << 20))
pmdp++; // linux 的 pmd
set_pmd(pmdp, __pmd(phys | prot));
// *pmdp = phys | prot
}
static inline void
alloc_init_page(unsigned long virt, unsigned long phys, unsigned int prot_l1, pgprot_t prot)
{
pmd_t *pmdp;
pte_t *ptep;
pmdp = pmd_offset(pgd_offset_k(virt), virt);
// 展开为(pmd_t *)init_mm->pgd + (virt) >> 21, the high 11bit of va
// 得到虚拟地址virt 在 first-level table中的位置
if (pmd_none(*pmdp)) { // 如果pmdp没设置过,分配一个second_level table
unsigned long pmdval;
ptep = alloc_bootmem_low_pages(2 * PTRS_PER_PTE *
sizeof(pte_t));
// alloc second_level table
pmdval = __pa(ptep) | prot_l1;
pmdp[0] = __pmd(pmdval);
pmdp[1] = __pmd(pmdval + 256 * sizeof(pte_t));
// 在这里填充first-level table对应项
flush_pmd_entry(pmdp);
}
ptep = pte_offset_kernel(pmdp, virt);
set_pte(ptep, pfn_pte(phys >> PAGE_SHIFT, prot));
// str r1, [r0]
// *ptep = pfn_pte(phys >> PAGE_SHIFT, prot),物理地址高20位加上保护位,放到一个second_level table 中的对应项
}