操作系统第四章——非连续内存分配

Jqivin

已于 2023-12-05 13:46:13 修改

阅读量65

点赞数

分类专栏：操作系统文章标签： windows

于 2021-10-12 23:58:48 首次发布

本文链接：https://blog.csdn.net/Jqivin/article/details/120734313

版权

操作系统专栏收录该内容

10 篇文章 0 订阅

订阅专栏

本文详细介绍了操作系统的非连续内存分配，包括分段和分页两种管理方法。分段允许更好的代码和数据共享，支持动态加载和链接，但可能导致地址转换复杂。分页则通过固定大小的页来提高内存利用率，减少了碎片问题，但页表的管理和硬件支持是其挑战。转换后备缓冲区(TLB)和多级页表是解决性能问题的有效手段。此外，反向页表、页寄存器和哈希方案也被讨论作为优化方法。

摘要由CSDN通过智能技术生成

第四章、非连续内存分配

第四章的主要内容是：操作系统的非连续内存分配

第三章介绍的是连续内存管理, 即 : 操作系统加载到内存以及程序加载到内存中时, 分配一块连续的空闲(内存)块. 但是容易出现碎片问题, 这一章介绍的非连续内存分配可以有效的减少碎片的出现.

非连续内存分配指的是非连续一个程序在内存中的地址是不连续的。

一、非连续内存分配的必要性

连续内存分配的缺点

分配给一个程序的物理内存是连续的
内存利用率低
有外碎片 / 内碎片的问题

非连续内存分配的优点

一个程序的物理地址空间是非连续的
更好的内存利用和管理
允许共享代码与数据(共享库等…)
支持动态加载和动态链接

非连续内存分配的缺点

建立虚拟地址和物理地址的转换难度大
- 软件方案
- 硬件方案(采用硬件方案) : 分段 / 分页

二、非连续内存分配管理方法

4-1

分段(Segmentation)

段 : 在程序中会有来自不同文件的函数 ; 在程序执行时, 不同的数据也有不同的字段, 比如 : 堆 / 栈 / .bss / .data 等

分段 : 更好的分离和共享

程序的分段地址空间如下图所示 :

4-2

分段寻址方案

逻辑地址空间连续，但是物理地址空间不连续，使用映射机制进行关联.

一个段 : 一个内存"块"

4-3

程序访问内存地址需要 : 一个二维的二元组(s, addr) → (段号, 地址)

操作系统维护一张段表（在进行寻址之前os就把要把这个段表建立好）, 存储(段号, 物理地址中的起始地址, 长度限制)

物理地址 : 段表中的起始地址 + 二元组中的偏移地址

4-4

分页(Paging)

上面介绍的分段寻址方案目前CPU使用的是较少的，绝大多数CPU使用的是分页的方案。分段和分页寻址方案的最大区别是：分段方案中段的大小是可以改变的，分页方案中页的大小是不可以改变的。

分页地址空间

划分物理内存至固定大小的帧(Frame)

大小是2的幂, 512 / 4096（4k） / 8192（8k）

划分逻辑地址空间至相同大小的页(Page)

大小是2的幂, 512 / 4096 / 8192

建立方案 → 转换逻辑地址为物理地址(pages to frames)

页表
MMU / TLB

帧(Frame) 物理内存中的“页”叫帧，逻辑内存中的单元叫页。不同的叫法而已。

物理内存被分割为大小相等的帧. 一个内存物理地址是一个二元组(f, o) → (帧号, 帧内偏移)

帧号 : F位, 共有2^F个帧

帧内偏移 : S位, 每帧有2^S个字节

物理地址 = 2^S * f + o

(例子 : 16-bit地址空间, 9-bit(512 byte) 大小的页帧物理地址 = (3,6) 物理地址 = 2^9 * 3 + 6 = 1542)

4-5
4-6

分页和分段的最大区别 : 这里的 S 是一个固定的数, 而分段中的长度限制不定

页(Page)

一个程序的逻辑地址空间被划分为大小相等的页. 页内偏移的大小 = 帧内偏移的大小页号大小 == 帧号大小

一个逻辑地址是一个二元组(p, o) → (页号, 页内偏移)

页号 : P位, 共有2^P个页

页内偏移 : S位, 每页有2^S个字节

虚拟地址 = 2^S * p + o

页寻址方案

操作系统维护一张页表, 页表保存了逻辑地址——物理地址之间的映射关系

存储 : (页号, 帧号)

逻辑地址空间应当大于物理内存空间(可能程序很小，但是逻辑地址空间是4G-32位操作系统)
页映射到帧
页是连续的虚拟内存
帧是非连续的物理内存(有助于减少碎片的产生)
不是所有的页都有对应的帧

4-7

关于这幅图：

我们知道，程序执行的时候，CPU要访问地址，不管是访问一条数据还是执行一个指令，都要首先知道这个数据或者指令的地址，这个地址是逻辑地址（虚拟地址）。逻辑地址分为两块（页号，偏移量）。我们首先关注页号，我们把页号作为一个索引去查一个pagetable（页表），这个页表中存储的是以页号为索引，帧号为表项的内容（简单理解）。我们通过查询页表可以得到页号对应的帧号，然后根据帧号和偏移量（逻辑地址和物理地址的偏移量是一样的）来计算出物理地址。

页表(Page Table)

页表概述

每一个运行的程序都有一个页表

属于程序运行状态, 会动态变化
PTBR : 页表基址寄存器

转换流程

CPU根据程序的page的页号的若干位, 计算出索引值index, 在页表中搜索这个index, 得到的是帧号, 帧号和原本的offset组成物理地址.

页表中还有一些特殊标志位

dirty bit：修改位（页面是否被修改过，如果被修改过，要写入磁盘，通常修改为也被称作脏位）
resident（居住） bit, (0 : 对应的物理页帧在内存中不存在 ; 1 : 存在)
clock / reference（引用，参照） bit：访问位，每次不管是否修改一个页面，都会被访问，是不是这个页面就不重要了呢？其实不是的。这个位记录是否被访问过，如果发生缺页中断的时候，可以将没有访问的页被置换掉。

4-8

转换实例

16位地址的系统

32KB的物理内存
每页的 1024 byte

逻辑地址空间 : (4, 0) … (3, 1023)

页表 :

Flags | Frame nums

1 0 1 0 0 0 0 0 → 内存访问异常(可能要杀死程序)

0 1 1 0 0 1 0 0 → 页帧是4 偏移是 1023 → 物理地址 (4, 1023)

4-9

4-10

分页机制的性能问题

访问一个内存单元需要2次内存访问

一次用于获取页表项（页表如果大的话，要放在内存中）
一次用于访问数据

页表可能非常大

64位机器如果每页1024字节, 那么一个页表的大小会是多少？(2^64 / 2^10 = 2^54 存放不下)
每一个运行的程序都需要有一个页表

如何处理？（解决时间和空间冲突带来的问题一般都是下面两种方法）

缓存(Caching)：TLB
间接(Indirection)访问：多级页表

转换后备缓冲区(TLB)

缓解时间问题

Translation Look-aside Buffer(TLB) 是一个缓冲区. CPU中有快表TLB(可以将经常访问的页表存放在这边)

缓存近期访问的页帧转换表项

TLB使用关联内存实现, 具备快速访问性能
如果TLB命中, 物理页号可以很快被获取
如果TLB未命中, 对应的表项被更新到TLB中(x86的CPU由硬件实现, 其他的可能是由操作系统实现)

二级/多级页表

时间换空间

二级页表

将页号分为两个部分, 页表分为两个, 一级页号对应一级页表, 二级页号对应二级页表.
一级页号查表获得在二级页表的起始地址, 地址加上二级页号的值, 在二级页表中获得帧号
节约了一定的空间, 在一级页表中如果resident bit = 0, 可以使得在二级页表中不存储相关index,而只有一张页表的话, 这一些index都需要保留

多级页表