Linux内存寻址之分段机制及分页机制

最新推荐文章于 2024-10-05 01:03:39 发布

benpaobagzb

最新推荐文章于 2024-10-05 01:03:39 发布

阅读量4.9k

点赞数 7

分类专栏： Linux C

本文链接：https://blog.csdn.net/benpaobagzb/article/details/50804328

版权

本文详细介绍了Linux内存寻址的分段和分页机制。从实模式到保护模式，解释了分段机制的起源、段描述符、段寄存器等概念，并探讨了Linux中如何简化和绕过分段机制。接着，文章讲解了IA32的分页机制，包括两级页表、页目录项和页面项，以及Linux如何利用分页实现内存寻址。最后，讨论了分页对性能的影响和Linux的分页策略，如四级页表的兼容性设计。

摘要由CSDN通过智能技术生成

前言

最近在学习Linux内核，读到《深入理解Linux内核》的内存寻址一章。原本以为自己对分段分页机制已经理解了，结果发现其实是一知半解。于是，查找了很多资料，最终理顺了内存寻址的知识。现在把我的理解记录下来，希望对内核学习者有一定帮助，也希望大家指出错误之处。

分段到底是怎么回事

相信学过操作系统课程的人都知道分段分页，但是奇怪的是书上基本没提分段分页是怎么产生的，这就导致我们知其然不知其所以然。下面我们先扒一下分段机制产生的历史。

实模式的诞生（16位处理器及寻址）

在8086处理器诞生之前，内存寻址方式就是直接访问物理地址。8086处理器为了寻址1M的内存空间，把地址总线扩展到了20位。但是，一个尴尬的问题出现了，ALU的宽度只有16位，也就是说，ALU不能计算20位的地址。为了解决这个问题，分段机制被引入，登上了历史舞台。
为了支持分段，8086处理器设置了四个段寄存器：CS, DS, SS, ES.每个段寄存器都是16位的，同时访问内存的指令中的地址也是16位的。但是，在送入地址总线之前，CPU先把它与某个段寄存器内的值相加。这里要注意：段寄存器的值对应于20位地址总线的中的高16位，所以相加时实际上是内存总线中的高12位与段寄存器中的16位相加，而低4位保留不变，这样就形成一个20位的实际地址，也就实现了从16位内存地址到20位实际地址的转换，或者叫“映射”。

保护模式的诞生（32位处理器及寻址）

80286处理器的地址总线为24位，寻址空间达16M，同时引入了保护模式（内存段的访问受到限制）
80386处理器是一个32位处理器，ALU和地址总线都是32位的，寻址空间达 4G。也就是说它可以不通过分段机制，直接访问4G的内存空间。虽然它是新时代的小王子，超越它的无数前辈，然而，它需要背负家族的使命–兼容前代的处理器。也就是说，它必须支持实模式和保护模式。所以，80386在段寄存器的基础上构筑保护模式，并且保留16位的段寄存器。
从80386之后的处理器，架构基本相似，统称为IA32（32 Bit Intel Architecture）。

IA32的内存寻址机制

寻址硬件

在 8086 的实模式下，把某一段寄存器左移4位，然后与地址ADDR相加后被直接送到内存总线上，这个相加后的地址就是内存单元的物理地址，而程序中的这个地址就叫逻辑地址（或叫虚地址）。在IA32的保护模式下，这个逻辑地址不是被直接送到内存总线而是被送到内存管理单元（MMU）。MMU由一个或一组芯片组成，其功能是把逻辑地址映射为物理地址，即进行地址转换，如图所示。
MMU

IA32的三种地址

逻辑地址:
机器语言指令仍用这种地址指定一个操作数的地址或一条指令的地址。这种寻址方式在Intel的分段结构中表现得尤为具体，它使得MS-DOS或Windows程序员把程序分为若干段。每个逻辑地址都由一个段和偏移量组成。
线性地址：
线性地址是一个32位的无符号整数，可以表达高达232（4GB）的地址。通常用16进制表示线性地址，其取值范围为0x00000000～0xffffffff。
物理地址：
也就是内存单元的实际地址ÿ