(转)linux虚拟内存管理简要总结

最新推荐文章于 2024-07-20 09:08:34 发布

gjq_1988

最新推荐文章于 2024-07-20 09:08:34 发布

阅读量558

点赞数

分类专栏： linux技术文章标签： kernel linux内核 linux

linux技术专栏收录该内容

30 篇文章 1 订阅

订阅专栏

以下讨论仅限i386平台，一般考虑典型情况

linux内核对整个系统的物理内存是通过类型为struct page的数组mem_map来管理的。系统中的伙伴系统分配算法最终是通过操作这个数组来记录物理内存的分配、回收等操作。在这里不要被系统的高端内存、低端内存等概念搞混淆了，高、低端内存的分类主要在于区分物理内存地址是否可以直接映射到内核线性地址空间中。

我们知道，linux的内核地址空间大小为1G（用户空间0~3G，内核空间3G~4G，这种分法最常见），因此如果把这1G线性地址空间全部拿来直接一一映射物理内存的话，在内核态的所有进程（线程）能使用的物理内存总共最多只有1G,为了能使在内核态的所有进程能使用更多的物理内存，linux采取了一种变通的形式：它将1G内核线性地址空间分为几部分，第一部分为1G的前896M，这部分内核线性空间与物理内存的0~896M一一映射（相差一个为0xc0000000的常数），后面128M的线性空间拿来动态映射剩下的所有物理内存，由于动态映射的方法不一样，后面的128M又分成了几个部分，有兴趣的可以查看相关资料。在这里，前面896M线性空间对应的物理内存就是所谓的低端物理内存，剩下的物理内存就是高端物理内存。

从上面高、低端物理内存命名的由来我们可以知道，高、低端物理内存与具体的内存分配算法无关，它们都是被mem_map数组控制起来，再由伙伴分配系统实施管理。

关于进程及其内存分配

首先要明白一个概念：进程中使用的所有地址都是虚地址，在linux下这个虚地址就是所谓的线性地址。linux中进程可运行在用户态和内核态，（典型配置情况下）当进程运行在用户态时，它使用的线性地址只能位于0~3G范围内，当进程运行于内核态时，它使用的线性地址地址范围为3G~4G。

为了把线性地址转化为物理地址，每个进程都有自己私有的页目录和页表。linux在建立进程页目录时，把用户地址空间的页目录项（0~767项）清空而将内核页目录表（swapper_pg_dir）的第768项到1023项拷贝到进程的页目录表的第768项到1023项中。由于内核在初始化时也只映射了物理内存的前896M，我们可以知道内核也目录表只能保证第768项开始的224项中有有效映射。从这里我们可以知道，所有的进程都共享了其内核线性地址空间。

当一个进程在内核空间发生缺页故障的时候，这主要发生在访问内核空间动态映射区线性地址，在其处理程序中，就要通过0号进程的页目录（swapper_pg_dir）来同步本进程的内核页目录，实际上就是拷贝0号进程的内核页目录到本进程中（内核页表与进程0共享，故不需要复制）。如果进程0的该地址处的内核页目录也不存在，则出错，具体代码可以参考vmalloc的实现源码。

当进程运行于用户态时，若其需要申请内存空间，内核首先会在其用户线性空间中分配需要的线性地址空间，再通过伙伴分配系统分配物理内存并把分配的物理内存跟用户空间线性地址映射起来，最后再修改进程的页目录项及页表项写入这些映射关系。

转一个知乎上的问答, 结论有待考证

[ARM Linux] 每个进程的内核页表为什么单独分配存储空间？

既然内核页表的内容被所有进程共享，那么为什么不同的进程的内核页表还要单独开辟存储空间，然后再从master page table里面memcpy内容？为什么要用深拷贝（memcpy master page table的内容）的方式而不用浅拷贝(所有进程共享同一份内核页表)的方式？

liheng gong

做了一些调查，初步的结论是，这样做可能是为了避免update TTBR0寄存器。
那么问题来了：在user land和kernel land之间切换的时候，为什么更新TTBR寄存器是不期望的？

Update: 更新TTBR 寄存器会导致TLB和ICache以及DCache性能的损失。user land和kernel land之间的切换在系统正常运行过程中是非常频繁的，如果每一次user land和kernel land切换都要更新TTBR寄存器，那么系统的performance会受到很大的impact。

另外还有一点就是，ARM架构要求一级页表必须是16KB 对齐的，另外一方面，kernel在给一级页表分配内存的时候，效率最高的是以2的某次方为单位来分配page，那么与其分配12KB的页表给每个进程，不如直接分配16KB，既达到了16KB对齐的目的，又有高效的分配方案。

Edit:
在quora上的一个问题看到Robert Love 大神的一段回答，正好能回答这个问题：
Why map both the user process and kernel into virtual memory at the same time? Why not map in the user process when in user-space and map the kernel when in kernel-space? One reason: Performance. Swapping the virtual address space incurs a nontrivial cost. Worse, depending on the system, various caches must be flushed. For example, on x86, the TLB, which caches virtual to physical address translations, must be flushed whenever the virtual mappings change. On systems with virtually-tagged caches, such as older ARM architectures, the entirety of the data and instruction cache must be flushed whenever you context switch! Cache performance is everything on modern systems, so avoiding such flushes is of paramount importance.

Consequently, by mapping both the kernel and user address spaces into memory at the same time, context switching into the kernel becomes relatively cheap, particularly on systems such as Linux where entry into the kernel is otherwise lightweight. On system call and interrupt-heavy workloads, this makes a very large and tangible difference, as the address space need not be swapped out and caches need not be flushed on every system call or interrupt.

quora 问题链接：https://www.quora.com/Why-do-32-bit-Linux-kernels-only-recognize-3GB-of-RAM

gjq_1988

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
(转)linux虚拟内存管理简要总结

以下讨论仅限i386平台，一般考虑典型情况linux内核对整个系统的物理内存是通过类型为struct page的数组mem_map来管理的。系统中的伙伴系统分配算法最终是通过操作这个数组来记录物理内存的分配、回收等操作。在这里不要被系统的高端内存、低端内存等概念搞混淆了，高、低端内存的分类主要在于区分物理内存地址是否可以直接映射到内核线性地址空间中。我们知道，linux的内
复制链接

扫一扫

专栏目录