arm linux内核页表清除,arm linux 页表(转)

最近在看arm linux 的mm部分,看的是2.6.8.1,芯片是INTEL PXA255,参考资料有arm linux演艺、《情景分析》等。一遍看下来只能说似懂非懂。这里有几个基础的问题,大家看看我的理解是否正确,另外还有一个小问题我没有理解。

arm 的mmu支持4K,16K,64K等几种页表和1M的段表(section),arm linux用的应该是4K(small page)页表和1M的section。

1M的段表地址比较简单,

[31:20] table index, 2048

[19:0] section index, 1M

4K页表的地址在ARM里是这样设置的:

[31:20] first-level table index,4096

[19:12] second-level table index,256

[11:0] page index

而在arm linux里PGD, PMD, PT的划分又如下:

[31:21] PGD, 2048

[20] PMD, 2

[19:12] PT, 512

但这里的PMD又形同虚设,因为PT一次总是操作相隔256的2的表项,高的为linux,低的为H/W

因此

PTRS_PER_PGD = 2048

PTRS_PER_PTE = 512

PERS_PE_PMD = 1

地址转换的时候,先找到PGD,这是存放在CP15 C2里面的,tssk->mm->pgd里存放每个任务的pgd。switch_mm的时候放入CP15 C2

cpu_switch_mm(next->pgd, next);

mcr p15, 0, r0, c2, c0, 0 @ load page table pointer, r0 = next->pgd

硬件根据CP15 C2的内容找到一个first-level descriptor table,也就是linux里的PGD,其高18位加上虚拟地址va的[31:20] (first-level table index),读取这个地址的内容(第一次读取内存),得到first-level descriptor。

如果first-level descriptor的最低2位是10,表示是section descriptor,则高12位加上va[19:0]就是物理地址。

如果first-level descriptor的最低2位是01,表示是Coarse page table descriptor,高22位(second-level table的地址)加上va[19:12](second-level table index),这个地址读到second-level descriptor(第二次读取内存),高20位加上va[11:0],就是最后的物理地址。

以上工作都是硬件自动完成的,arm linux 要做的,就是设置PGD表(first-level table)和页表(second-level table)。

比如内核的PGD,放在swapper_pg_dir数组的下标0项,同时保存在init_task->mm->pgd中。

但是看到分配页表的函数create_mapping,有个小问题。

static void __init create_mapping(struct map_desc *md)

{

...

while ((virt & 0xfffff || (virt + off) & 0xfffff) && length >= PAGE_SIZE) {

alloc_init_page(virt, virt + off, prot_l1, prot_pte);

virt += PAGE_SIZE;

length -= PAGE_SIZE;

}// 如果地址不是1M对齐的,则先给头上一部分分配页表,按页大小(4K)分配、填充页表

while (length >= (PGDIR_SIZE / 2)) {

alloc_init_section(virt, virt + off, prot_sect);

virt += (PGDIR_SIZE / 2);

length -= (PGDIR_SIZE / 2);

}// 这里的地址已经是1M对齐的了,设置PGD对应项,按1M分配、填充段表

while (length >= PAGE_SIZE) {

alloc_init_page(virt, virt + off, prot_l1, prot_pte);

virt += PAGE_SIZE;

length -= PAGE_SIZE;

}// 1M对齐剩下的尾巴,分配页表

...

}

这里都要设置descriptor的保护位,也就是没有被地址用到的那些位,表示一些状态属性。

alloc_init_section只需要段保护位prot_sect就可以了,这个没什么问题,比如我用的板子,

prot_sect = 0x42e

// 010000101110

// section descriptor

// cache and buffer

// domain = 1,kernel

// ap = 01, read/write

而alloc_init_page由于有first-level table 和 second-level table,需要两个保护位,分别是prot_l1, prot_pte

奇怪的是,代入的两个数值

prot_pte = 0x0

// 没有任何设置

prot_l1 = 0x20

// domain = 1,kernel

因为类型为MEMORY的存储设备,默认的prot_pte和prot_l1都是0。

虽然我用的PXA255开发板,地址是1M对齐的,且后面没有多余的地址,不需要前后两段分配页表(相信多数的处理器和开发板也是这样),但是既然有这样的代码,就应该赋给正确的值。

后面还有一段,映射中断向量表所在的区域

init_maps->physical = virt_to_phys(init_maps);

init_maps->virtual = vectors_base();

init_maps->length = PAGE_SIZE;

init_maps->type = MT_VECTORS;

create_mapping(init_maps);

这里面的保护位就没什么问题

prot_pte = 0xcb

// 11001011

// Extended small page base address

// cache not buffer

// read only?

// TEX = 11

prot_l1 = 0x1

// Coarse page table base address

// domain = 0, user

哪位研究过arm linux mm的朋友能解释一下?

下面是对上面用到的几个函数的展开分析。

static inline void

alloc_init_section(unsigned long virt, unsigned long phys, int prot)

{

pmd_t *pmdp;

pmdp = pmd_offset(pgd_offset_k(virt), virt);

// 展开为(pmd_t *)init_mm->pgd + (virt) >> 21, the high 11bit of va

// 得到虚拟地址virt 在 first-level table中的位置

if (virt & (1 << 20))

pmdp++; // linux 的 pmd

set_pmd(pmdp, __pmd(phys | prot));

// *pmdp = phys | prot

}

static inline void

alloc_init_page(unsigned long virt, unsigned long phys, unsigned int prot_l1, pgprot_t prot)

{

pmd_t *pmdp;

pte_t *ptep;

pmdp = pmd_offset(pgd_offset_k(virt), virt);

// 展开为(pmd_t *)init_mm->pgd + (virt) >> 21, the high 11bit of va

// 得到虚拟地址virt 在 first-level table中的位置

if (pmd_none(*pmdp)) { // 如果pmdp没设置过,分配一个second_level table

unsigned long pmdval;

ptep = alloc_bootmem_low_pages(2 * PTRS_PER_PTE *

sizeof(pte_t));

// alloc second_level table

pmdval = __pa(ptep) | prot_l1;

pmdp[0] = __pmd(pmdval);

pmdp[1] = __pmd(pmdval + 256 * sizeof(pte_t));

// 在这里填充first-level table对应项

flush_pmd_entry(pmdp);

}

ptep = pte_offset_kernel(pmdp, virt);

set_pte(ptep, pfn_pte(phys >> PAGE_SHIFT, prot));

// str r1, [r0]

// *ptep = pfn_pte(phys >> PAGE_SHIFT, prot),物理地址高20位加上保护位,放到一个second_level table 中的对应项

}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值