408操作系统知识点——第三章 内存管理

文章目录


注:内容参考王道2024考研复习指导

内存管理概念

内存管理的主要功能

  1. 内存空间的分配与回收:操作系统负责内存空间的分配和管理,记录内存的空闲空间、内存的分配情况,并回收已结束进程所占用的内存空间。
  2. 内存空间的扩充:利用虚拟存储技术从逻辑上扩充内存。
  3. 地址转换:操作系统负责实现逻辑地址到物理地址的转换。
  4. 存储保护:保证各进程在自己的内存空间内运行,不会越界访问。

进程运行的基本原理和要求

程序的装入

逻辑地址(相对地址):程序经过编译、链接后生成的指令中指明的是逻辑地址,即相对于进程的起始地址而言的地址。

image-20240520185136491

绝对装入

在编译时,如果知道程序将放到内存中的哪个位置,编译程序将产生绝对地址的目标代码。装入程序按照装入模块中的地址,将程序和数据装入内存。

例如,如果知道装入模块要从物理地址为100的地方开始存放…装入模块内如如下:

image-20240520185314598

绝对装入只适用于单道程序环境。

程序中使用的绝对地址,可在编译或汇编时给出,也可由程序员直接赋予。通常情况下都是编译或汇编时再转换为绝对地址。

可重定位装入

又称静态重定位。

编译、链接后的装入模块的地址都是从0开始的,指令中使用的地址、数据存放的地址都是相对于起始地址而言的逻辑地址。

可根据内存的当前情况,将装入模块装入(执行可重定位装入程序)到内存的适当位置。装入时对地址进行“重定位”,将逻辑地址变换(需要地址变换机构重定位寄存器)为物理地址(地址变换是在装入时一次完成的)。

例如:装入的起始物理地址为100,则所有地址相关的参数都+100…

静态重定位的特点是在一个作业装入内存时,必须分配其要求的全部内存空间,如果没有足够的内存,就不能装入该作业。作业一旦进入内存后,在运行期间就不能再移动,也不能再申请内存空间。

动态运行时装入

又称动态重定位。

编译、链接后的装入模块的地址都是从0开始的。装入程序把装入模块装入内存后,并不会立即把逻辑地址转换为物理地址,而是把地址转换推迟到程序真正要执行时才进行地址转换。因此装入内存后所有的地址依然是逻辑地址。这种方式需要一个重定位寄存器的支持。

采用动态重定位时允许程序在内存中发生移动。

程序的链接

  • 静态链接:在程序运行之前,先将各目标模块及它们所需的库函数连接成一个完整的可执行文件(装入模块),之后不再拆开。

主要完成两件事情,1)修改相对地址,编译后所有的目标模块都是从0开始的相对地址,链接时需要修改;2)变换外部调用符号(被调用的变量和函数)为相对地址。

  • 装入时动态链接:将各目标模块装入内存时,边装入边链接的链接方式。

  • 运行时动态链接:在程序执行中需要该目标模块时,才对它进行链接。其优点是便于修改和更新,便于实现对目标模块的共享。

内存保护

内存分配前需要保护操作系统不受用户进程影响,同时保护用户进程不受其他用户进程影响,主要方式:

  • 在CPU中设置一对上、下限寄存器,存放进程的上、下限地址。进程的指令要访问某个地址时,CPU检查是否越界。
  • 采用重定位寄存器(又称基址寄存器)和界地址寄存器(又称限长寄存器)进行越界检查。重定位寄存器中存放的是进程的起始物理地址。界地址寄存器中存放的是进程的最大逻辑地址。

注1:重定位寄存器作用为“加法”,逻辑地址+重定位寄存器值=物理地址;界地址寄存器作用为“比较”,逻辑地址与界地址寄存器值进行比较判断是否越界。

注2:内存保护是内存管理的一部分,是操作系统的任务,但是处于安全性和效率考虑,必须由硬件实现。

进程的内存映像

设32位系统,进程虚拟地址空间为4GB。

代码段:即程序的二进制代码,代码段是只读的,可以被多个进程共享。

数据段:即程序运行时加工处理的对象,包括全局变量和静态变量。

进程控制块(PCB):存放在系统区。操作系统通过PCB来控制和管理进程。

堆:用来存放动态分配的变量。通过调用malloc函数动态地向高地址分配空间。

栈:用来实现函数调用。从用户空间的最大地址往低地址方向增长。

image-20240520190314191

:对于宏定义的常量, 不专门分配存储空间,在预编译阶段,会将代码中的X替换为1024。

覆盖与交换

覆盖技术

覆盖技术的思想:将程序分为多个段(多个模块)。常用的段常驻内存,不常用的段在需要时调入内存。

内存中分为一个“固定区”和若干个“覆盖区”。需要常驻内存的段放在“固定区”中,调入后就不再调出(除非运行结束)。不常用的段放在“覆盖区”,需要用到时调入内存,用不到时调出内存。

例:按照自身逻辑结构,让那些不可能同时被访问的程序段共享同一个覆盖区。

image-20240520190901401

必须由程序员声明覆盖结构,操作系统完成自动覆盖。但缺点是对用户不透明,增加了用户编程负担。

覆盖技术只用于早期的操作系统中,现在已成为历史。

交换技术

内存空间紧张时,系统将内存中某些进程暂时换出外存,把外存中某些已具备运行条件的进程换入内存(进程在内存与磁盘间动态调度)。

中级调度(内存调度),就是要决定将哪个处于挂起状态的进程重新调入内存。

对换进程的保存位置

具有对换功能的操作系统中,通常把磁盘空间分为文件区和对换区两部分。

文件区主要用于存放文件,主要追求存储空间的利用率,因此对文件区空间的管理采用离散分配方式。

对换区空间只占磁盘空间的小部分,被换出的进程数据就存放在对换区。

由于对换的速度直接影响到系统的整体速度,因此对换区空间的管理主要追求换入换出速度,因此通常对换区采用连续分配方式。

总之,对换区的I/O速度比文件区的更快。

交换时机

交换通常在许多进程运行且内存吃紧时进行,而系统负荷降低就暂停。例如:在发现许多进程运行时经常发生缺页,就说明内存紧张,此时可以换出一些进程;如果缺页率明显下降,就可以暂停换出。

换出进程的优先级

可优先换出阻塞进程;可换出优先级低的进程;为了防止优先级低的进程在被调入内存后很快又被换出,有的系统还会考虑进程在内存的驻留时间。

:PCB会常驻内存,不会被换出外存。

连续分配管理方式

连续分配方式是指为一个用户程序分配一个连续的内存空间。

单一连续分配

内存被分为系统区和用户区。系统区通常位于内存的低地址部分,用于存放操作系统相关数据;用户区用于存放用户进程相关数据。

内存中只能有一道用户程序,用户程序独占整个用户区空间。

优点:简单,无外部碎片,不需要采取内存保护,可以采用覆盖技术扩充内存。

缺点:只能用于单用户、单任务的操作系统中,有内部碎片,存储器利用率极低。

:内部碎片是指分配给某进程的内存区域中,如果有些部分没有用上。

image-20240520191744329

固定分区分配

固定分区分配时最简单的一种多道程序存储管理方式。它将整个用户空间划分为若干个固定大小的分区,在每个分区中只装入一道作业。

两种划分分区的方法:

  • 分区大小相等分配:缺乏灵活性,但是很适合用于用一台计算机控制多个相同对象的场合。
  • 分区大小不等分配:增加了灵活性,可以满足不同大小的进程需求。根据常在系统中运行的作业大小情况进行划分。

image-20240520191903189

固定分区分配需要建立一个数据结构,分区说明表(分区使用表,通常按分区大小排列),来实现各个分区的分配与回收。表项包括对于分区的大小、起始地址、状态。

image-20240520192034092

优点:实现简单,无外部碎片。

缺点:当用户程序太大时,可能所有的分区都不能满足需求,此时不得不采用覆盖技术来解决,但这又会降低性能;会产生内部碎片,内存利用率低。

动态分区分配

又称为可变分区分配。这种分配方式不会预先划分内存分区,而是在进程装入内存时,根据进程的大小动态地建立分区,并使分区的大小正好适合进程的需要。因此系统分区的大小和数目是可变的。

数据结构记录内存的使用情况

常用空闲分区表或者空闲分区链记录内存情况。

空闲分区表:每个空闲分区对应一个表项。表项中包含分区号、分区大小、分区起始地址等信息。

空闲分区链:每个分区的起始部分和末尾部分分别设置前向指针和后向指针。起始部分处还可记录分区大小等信息。

image-20240520192341802

选择分区

按照一定的动态分区分配算法从空闲分区表(或空闲分区链)中选出一个分区分配给该作业。

分区分配和回收

分区分配后需要更改空闲分区表的对应信息。

分区回收

  • 回收区的后面有一个相邻的空闲分区,两个相邻的空闲分区合并为一个。

  • 回收区的前面有一个相邻的空闲分区,两个相邻的空闲分区合并为一个。

  • 回收区的前、后各有一个相邻的空闲分区,三个相邻的空闲分区合并为一个。

动态分区分配没有内部碎片,但是有外部碎片,可以通过紧凑(拼凑,Compaction)技术来解决外部碎片。

:外部碎片,是指内存中的某些空闲分区由于太小而难以利用。

动态分区分配算法

基于顺序搜索的分配算法

首次适应算法

每次都从低地址开始查找,找到第一个能满足大小的空闲分区。

空闲分区以地址递增的次序排列每次分配内存时顺序查找空闲分区链(或空闲分区表),找到大小能满足要求的第一个空闲分区。

邻近适应算法

每次都从上次查找结束的位置开始检索,就能解决首次适应算法查找的开销的问题。

空闲分区以地址递增的顺序排列(可排成一个循环链表)。每次分配内存时从上次查找结束的位置开始查找空闲分区链(或空闲分区表),找到大小能满足要求的第一个空闲分区。

最佳适应算法

为了保证当“大进程”到来时能有连续的大片空间,可以尽可能多地留下大片的空闲区,即,优先使用更小的空闲区。

空闲分区按容量递增次序链接,每次分配内存时顺序查找空闲分区链(或空闲分区表),找到大小能满足要求的第一个空闲分区。

缺点:每次都选最小的分区进行分配,会留下越来越多的、很小的、难以利用的内存块。因此这种方法会产生最多的外部碎片。

最坏适应算法

又称最大适应算法(Largest Fit)。在每次分配时优先使用最大的连续空闲区,这样分配后剩余的空闲区就不会太小,更方便使用。

空闲分区按容量递减次序链接,每次分配内存时顺序查找空闲分区链(或空闲分区表),找到大小能满足要求的第一个空闲分区。

缺点:这种方式会导致较大的连续空闲区被迅速用完。如果之后有“大进程”到达,就没有内存分区可用了。

总结

image-20240520193514782

基于索引搜索的分配算法

在大、中型系统中往往采用索引分配算法。

索引分配算法的思想是,根据其大小对空闲分区分类,对于每类(大小相同)空闲分区,单独设立一个空闲分区链,并设置一张索引表来管理这些空闲分区链。

当为进程分配空间时,在索引表中查找所需空间大小对应的表项,并从中得到对应的空闲分区链的头指针,从而获得一个空闲分区。

快速适应算法

空闲分区根据进程常用的空间大小进程划分。

分配过程

  1. 根据进程长度,在索引表中找到能容纳它的最小空闲分区链表;
  2. 从链表的中取出第一块进行分配。

优点:查找效率高,不产生内部碎片。

缺点:为有效回收分区,算法复杂,系统开销大。

伙伴系统

规定所有分区的大小均为2的k次幂。

分配过程

  1. 需要为进行分配大小为n的分区时( 2 i − 1 < n ≤ 2 i 2^{i-1} < n \leq 2^{i} 2i1<n2i),在大小为 2 i 2^i 2i的空闲分区链中寻找;
  2. 若找到,则进行分配;
  3. 若该链没有空闲分区,则在大小为 2 i + 1 2^{i+1} 2i+1的空闲分区链中查找;
  4. 若该链存在空闲分区,则将分区等分成两个分区,称这两个分区为一对伙伴,其中一个分配给进程,另一个加入大小为 2 i 2^i 2i的空闲分区链;
  5. 若该链也不存在空闲分区,则继续往更大的空闲分区链查找,知道找到为止。

回收过程

  1. 当释放内存时,会扫描对应大小的内存块链表,查看是否存在地址能够连续在一起的内存块;
  2. 如果发现有,那么就合并两个内存块放置到更大一级的内存块链表上,以此类推,继续向上级合并。

例:释放8KB大小的内存,那么会从对应的链表扫描是否有能够合并的内存块,如果有另一个8KB大小的内存和我们使用的内存地址连续,那么就合并它们组成一个16KB大小的内存块,然后接着扫描16KB大小的内存块链表,继续查找合并的可能,以此类推下去。

哈希算法

根据空闲分区链表的分布规律,建立哈希函数,构建一张以空闲分区大小为关键字的哈希表,每个表项记录一个对应空闲分区链的头指针。分配时,根据所需分区大小,通过哈希函数计算得到哈希表中的位置,从中得到相应的空闲分区链表。

基本分页存储管理

连续分配:为用户进程分配的必须是一个连续的内存空间。

非连续分配:为用户进程分配的可以是一些分散的内存空间。

分页存储

将内存空间(即实际的物理空间)分为一个个大小相等的分区,每个分区就是一个页框(也称页帧、内存块、物理块、物理页面)。每个页框有一个编号,叫做页框号,页框号从0开始。

将进程的逻辑地址空间分为与页框大小相等的一个个部分,每个部分成为一个页面。每个页面也有一个编号,叫做页号,页号也从0开始。

操作系统以页框为单位为各个进程分配内存空间,进程的每个页面放入一个页框中,即页面与页框有一一对应的关系。

:页框不能太大,否则可能产生过大的内部碎片造成浪费。

页表

为了知道进程的每个页面在内存中存放的位置,操作系统为每个进程建立一张页表(存在PCB中)。

image-20240520194415527

  1. 一个进程对应一张页表。
  2. 进程的每个页面对应一个页表项(页表的一行)。
  3. 每个页表项由“页号”和“块号”组成。
  4. 页表记录进程页面和实际存放的内存块之间的映射关系。
  5. 每个页表项的长度是相同的。

注1:页表项连续存放,因此页号可以是隐含的,不占存储空间。

注2:计算机中内存块的数量(页面数量/页框数量)等于页表项中块号至少占多少字节

逻辑地址结构

image-20240520195357256

如果有K位表示“页内偏移量”,则说明该系统中一个页面的大小是2K个内存单元。

如果有M位表示“页号”,则说明在该系统中,一个进程最多允许有2M个页面。

地址转换

步骤:1)确定页号;2)找到内存中的起始地址;3)确定页内偏移量。

物理地址= 起始地址+页内偏移量

如何计算

页号=逻辑地址/页面长度

页内偏移量=逻辑地址%页面长度

逻辑地址可以拆分为(页号,页内偏移量),通过页号查询页表,可知页面在内存中的起始地址。

:页表中记录的只是内存块号,而不是内存块的起始地址。起始地址=块号*内存块大小。

若页面大小要为2的整数幂

  1. 逻辑地址的拆分更加迅速

如果每个页面大小为2KB,用二进制数表示逻辑地址,则末尾K位即为页内偏移量,其余部分就是页号。

  1. 物理地址的计算更加迅速

根据逻辑地址得到页号,根据页号查询页表从而找到页面存放的内存块号,将二进制表示的内存块号和页内偏移量拼接起来,就可以得到最终的物理地址。

基本地址变换机构

基本地址变换机构可以借助进程的页表将逻辑地址转换为物理地址。

系统中设置一个页表寄存器(PTR),存放页表在内存中的起始地址F和页表长度M。进程未执行时,页表的始址和页表长度放在进程控制块(PCB)中,当进程被调度时,操作系统内核会把它们放到页表寄存器中。

地址变换过程
  1. 算页号、页内偏移量
  2. 检查页号合法性
  3. 查页表,找到页面存放的内存块号
  4. 根据内存块号与页内偏移量得到物理地址
  5. 访问目标内存单元

:访问一个逻辑地址需要两次访存。

例:设页面大小为L(2的整数幂),逻辑地址A到物理地址E的变换过程如下

image-20240520195837406

在分页存储管理(页式管理)的系统中,只要确定了每个页面的大小,逻辑地址结构就确定了。

页式管理中地址是一维的,只要给出一个逻辑地址,系统就可以自动地算出页号、页内偏移量两个部分,并不需要显式地告诉系统这个逻辑地址中,页内偏移量占多少位。

引入快表的地址变换机构

快表

又称联想寄存器(TLB),是一种访问速度比内存快很多的高速缓存,用来存放最近访问的页表项的副本,可以加速地址变换的速度。

与此对应,内存中的页表常称为慢表。

地址变换过程
  1. 算页号、页内偏移量
  2. 检查页号合法性
  3. 查快表。若命中,即可知道页面存放的内存块号,可直接进行5;若未命中则进行4
  4. 查页表,找到页面存放的内存块号,并且将页表项复制到快表中
  5. 根据内存块号与页内偏移量得到物理地址
  6. 访问目标内存单元

:访问一个逻辑地址如果快表命中,只需访存一次;如果未命中,需访存两次。

image-20240520201415682

:TLB和普通Cache的区别是TLB中只有页表项的副本,而普通Cache中可能会有其他各种数据的副本。

两级页表

把页表再分页并离散存储,然后再建立一张页表记录页表各个部分的存放位置,称为页目录表(或称外层页表,或称顶层页表)。

两级页表的地址结构

image-20240520202235634

地址变换
  1. 按照地址结构将逻辑地址拆成三部分
  2. 从PCB读出页目录表始地址,在根据一级页号查页目录表,找到下一级页表在内存中的存放位置
  3. 根据二级页号查二级页表,找到最终想访问的内存块号
  4. 结合页内偏移量得到物理地址

可以在需要访问页面时才把页面调入内存(虚拟存储技术)。可以在页表项中增加一个标志位,用于表示该页面是否已经调入内存。

若想访问的页面不在内存中,则产生缺页中断(内中断/异常),然后将目标页面从外存调入内存。

注1:多级页表中,各级页表的大小不能超过一个页面。若两级页表不够,可以分更多级。

注2:多级页表的访存次数(假设没有快表机构),N级页表访问一个逻辑地址需要N+1次访存。

基本分段存储管理

分页通过硬件机制实现,对用户完全透明;而分段管理方式考虑到用户和程序员,为了满足用户的方便编程、分段共享、分段保护、动态链接和动态增长等要求。

分段存储

按照程序自身的逻辑关系划分为若干个段,每个段都有一个段名(在低级语言中,程序员使用段名来编程),每段从0开始编址。

内存分配规则:以段为单位进行分配,每个段在内存中占据连续空间,但各段之间可以不连续。

image-20240520202908191

段号的位数决定了每个进程最多可以分几个段,段内地址位数决定了每个段的最大长度是多少。

段表

为每个进程建立一张段映射表,简称“段表”,能从物理内存中找到各个逻辑段的存放位置。

image-20240520203011938

:段号可以是隐含的,不占存储空间。

地址转换

  1. 由逻辑地址得到段号、段内地址
  2. 段号与段表寄存器中的段长度比较,检查是否越界
  3. 由段表始址、段号找到对应段表项
  4. 根据段表中记录的段长,检查段内地址是否越界
  5. 由段表中的"基址+段内地址"得到最终的物理地址
  6. 访问目标单元

image-20240520203308921

分段、分页管理的对比

分页管理分段管理
页是信息的物理单位,对用户不可见。段是信息的逻辑单位,分段对用户可见。
页的大小固定且由系统决定。段长不固定,取决于用户编写的程序。
分页的进程地址空间是一维的,只需给出一个记忆符即可表示一个地址。分段的进程地址空间是二维的,既要给出段名(确定段长和段号),也要给出段内地址。
不方便按照逻辑模块实现信息的共享和保护。容易实现信息的共享和保护。

段页式管理方式

分页、分段的优缺点分析

优点缺点
分页管理内存空间利用率高,不会产生外部碎片,只会有少量的页内碎片不方便按照逻辑模块实现信息的共享和保护
分段管理很方便按照逻辑模块实现信息的共享和保护段长过大,为其分配很大的连续空间会很不方便,段式管理会产生外部碎片

分段+分页

将进程按逻辑模块分段,再将各段分页(如每个页面4KB),再将内存空间分为大小相同的内存块,进程将各页面分别装入各内存块中。

image-20240520205000734

逻辑地址结构

image-20240520205114044

段号的位数决定了每个进程最多可以分几个段;页号位数决定了每个段最多有多少;页内偏移量决定了页面大小是多少。

“分段”对用户是可见的,需要显式地给出段号、段内地址。而将各段“分页”对用户是不可见的。系统会根据段内地址自动划分页号和页内偏移量。因此段页式管理的地址结构是二维的。

记录结构

每个段对应一个段表项,每个段表项由段号、页表长度、页表存放块号(页表起始地址)组成。

每个页面对应一个页表项,每个页表项由页号、页面存放的内存块号组成。

段号、页号是隐含的。

image-20240520205549543

地址转换

  1. 由逻辑地址得到段号、页号、页内偏移量
  2. 段号与段表寄存器中的段长度比较,检查是否越界
  3. 由段表始址、段号找到对应段表项
  4. 根据段表中记录的页表长度,检查页号是否越界
  5. 由段表中的页表地址、页号得到查询页表,找到相应页表项
  6. 由页面存放的内存块号、页内偏移量得到最终的物理地址访问目标单元

image-20240520205655939

虚拟内存管理

虚拟内存技术允许将一个作业分多次调入内存。虚拟内存的实现需要建立在离散分配的内存管理方式的基础上。

虚拟内存的实现有以下三种方式:请求分页存储管理;请求分段存储管理;请求段页式存储管理。

不管哪种方式,都需要有一定的硬件支持。一般需要的支持有以下几个方面:

  1. 一定容量的内存和外存。
  2. 页表机制(或段表机制),作为主要的数据结构。
  3. 中断机构,当用户程序要访问的部分尚未调入内存时,则产生中断。
  4. 地址变换机构,逻辑地址到物理地址的变换。

虚拟内存基本概念

传统存储管理的特征

一次性:作业必须一次性全部装入内存后才能开始运行。这会造致大作业无法运行;导致多道程序并发度下降。

驻留性:一旦作业被装入内存,就会一直驻留在内存中,直至作业运行结束。浪费了宝贵的内存资源。

虚拟内存的定义

基于局部性原理,在程序装入时,可以将程序中很快会用到的部分装入内存,暂时用不到的部分留在外存,就可以让程序开始执行。

在程序执行过程中,当所访问的信息不在内存时,由操作系统负责将所需信息从外存调入内存,然后继续执行程序。

若内存空间不够,由操作系统负责将内存中暂时用不到的信息换出到外存。

在操作系统的管理下,在用户看来似乎有一个比实际内存大得多的内存(逻辑上进行了扩充),这就是虚拟内存。

虚拟内存的特征

多次性:无需在作业运行时一次性全部装入内存,而是允许被分成多次调入内存。

对换性:在作业运行时无需一直常驻内存,而是允许在作业运行过程中,将作业换入、换出。

虚拟性:从逻辑上扩充了内存的容量,使用户看到的内存容量,远大于实际的容量。

注1:虚拟内存的最大容量是由计算机的地址结构(CPU寻址范围)确定的。

注2:虚拟内存的实际容量= min(内存和外存容量之和,CPU寻址范围)

请求分页管理方式

请求分页系统建立在基本分页系统的基础上。

在程序执行过程中,当所访问的信息不在内存时,由操作系统负责将所需信息从外存调入内存(请求调页),然后继续执行程序。若内存空间不够,由操作系统负责将内存中暂时用不到的信息换出到外存(页面置换)。

请求分页=基本分页+请求调页+页面置换。

页表机制

image-20240520210455692

缺页中断机构

在请求分页系统中,每当要访问的页面不在内存时,便产生一个缺页中断(内中断,属于程序性异常),然后由操作系统的缺页中断处理程序处理中断。此时缺页的进程阻塞,放入阻塞队列,调页完成后再将其唤醒,放回就绪队列。

如果内存中有空闲块,则为进程分配一个空闲块,将所缺页面装入该块,并修改页表中相应的页表项。

如果内存中没有空闲块,则由页面置换算法选择一个页面淘汰,若该页面在内存期间被修改过,则要将其写回外存。未修改过的页面不用写回外存。

地址变换机构

image-20240520210738001

页面置换算法

最佳置换算法(OPT)

每次选择淘汰的页面将是以后永不使用,或者在最长时间内不再被访问的页面,这样可以保证最低的缺页率。

最佳置换算法可以保证最低的缺页率,但实际上,只有在进程执行的过程中才能知道接下来会访问到的是哪个页面。操作系统无法提前预判页面访问序列。因此,最佳置换算法是无法实现的

先进先出置换算法(FIFO)

每次选择淘汰的页面是最早进入内存的页面。

实现方法:把调入内存的页面根据调入的先后顺序排成一个队列,需要换出页面时选择队头页面即可。队列的最大长度取决于系统为进程分配了多少个内存块。

Belady异常

当为进程分配的物理块数增大时,缺页次数不减反增的异常现象。

只有FIFO算法会产生Belady异常。

FIFO算法虽然实现简单,但是该算法与进程实际运行时的规律不适应,因为先进入的页面也有可能最经常被访问。因此,算法性能差

最近最久未使用置换算法(LRU)

每次淘汰的页面是最近最久未使用的页面

实现方法:赋予每个页面对应的页表项中,用访问字段记录该页面自上次被访问以来所经历的时间t。当需要淘汰一个页面时,选择现有页面中t值最大的,即最近最久未使用的页面。

该算法的实现需要专门的硬件支持(原因是算法需要对所有的页面进行排序。结果导致需要硬件的特殊支持),虽然算法性能好,但是实现困难,开销大。

:在手动做题时,若需要淘汰页面,可以逆向检查此时在内存中的几个页面号。在逆向扫描过程中最后一个出现的页号就是要淘汰的页面。

时钟置换算法(CLOCK)

实现方法:为每个页面设置一个访问位,再将内存中的页面都通过链接指针链接成一个循环队列。

当某页被访问时,其访问位置为1。当需要淘汰一个页面时,只需检查页的访问位。

如果是0,就选择该页换出;如果是1,则将它置为0,暂不换出,继续检查下一个页面。

若第一轮扫描中所有页面都是1(即没有页面换出),则将这些页面的访问位依次置为0后,再进行第二轮扫描(第二轮扫描中一定会有访问位为0的页面,因此简单的CLOCK算法选择一个淘汰页面最多会经过两轮扫描)。

改进型的时钟置换算法

简单的时钟置换算法仅考虑到一个页面最近是否被访问过。改进型时钟算法考虑在其他条件都相同时,应优先淘汰没有修改过的页面。

修改位=0,表示页面没有被修改过;修改位=1,表示页面被修改过。

用(访问位,修改位)的形式表示各页面状态。如(1,1)表示一个页面近期被访问过,且被修改过。

算法规则:

  • 第一轮:从当前位置开始扫描到第一个(0, 0)的帧用于替换。本轮扫描不修改任何标志位。(寻找未访问,未修改的页面)

  • 第二轮:若第一轮扫描失败,则重新扫描,查找第一个(0, 1)的帧用于替换。本轮将所有扫描过的帧访问位设为0。(寻找未访问,但修改的页面)

  • 第三轮:若第二轮扫描失败,则重新扫描,查找第一个(0, 0)的帧用于替换。本轮扫描不修改任何标志位。(寻找访问过,未修改的页面)

  • 第四轮:若第三轮扫描失败,则重新扫描,查找第一个(0, 1)的帧用于替换。(寻找访问过,修改的页面)

:改进型CLOCK置换算法选择一个淘汰页面最多会进行四轮扫描。

总结

image-20240520211823961

页面分配策略

驻留集:指请求分页存储管理中给进程分配的物理块的集合。

固定分配:操作系统为每个进程分配一组固定数目的物理块,在进程运行期间不再改变。即,驻留集大小不变

可变分配:先为每个进程分配一定数目的物理块,在进程运行期间,可根据情况做适当的增加或减少。即,驻留集大小可变

局部置换:发生缺页时只能选进程自己的物理块进行置换。

全局置换:可以将操作系统保留的空闲物理块分配给缺页进程,也可以将别的进程持有的物理块置换到外存,再分配给缺页进程。

image-20240520213134346

固定分配局部置换

系统为每个进程分配一定数量的物理块,在整个运行期间都不改变。

若进程在运行中发生缺页,则只能从该进程在内存中的页面中选出一页换出,然后再调入需要的页面。

缺点是:很难在刚开始就确定应为每个进程分配多少个物理块才算合理。(采用这种策略的系统可以根据进程大小、优先级、或是根据程序员给出的参数来确定为一个进程分配的内存块数)。

物理块调入算法

对于固定分配策略,可以采用以下几种算法对系统中空闲的物理块进行分配:

  1. 平均分配算法,将系统中所有可供分配的物理块平均分配给各个进程。
  2. 按比例分配算法,根据进程的大小按比例分配物理块。
  3. 优先权分配算法,为重要和紧迫的进程分配较多的物理块。通常采取的方法是将所有可分配的物理块分成两部分:一部分按比例分配给各个进程;一部分则根据优先权分配。

可变分配全局置换

刚开始会为每个进程分配一定数量的物理块。操作系统会保持一个空闲物理块队列。

当某进程发生缺页时,从空闲物理块中取出一块分配给该进程;若已无空闲物理块,则可选择一个未锁定的页面换出外存,再将该物理块分配给缺页的进程。

采用这种策略时,只要某进程发生缺页,都将获得新的物理块,仅当空闲物理块用完时,系统才选择一个未锁定的页面调出。被选择调出的页可能是系统中任何一个进程中的页,因此这个被选中的进程拥有的物理块会减少,缺页率会增加。

可变分配局部置换

刚开始会为每个进程分配一定数量的物理块。

当某进程发生缺页时,只允许从该进程自己的物理块中选出一个进行换出外存。

如果进程在运行中频繁地缺页,系统会为该进程多分配几个物理块,直至该进程缺页率趋势适当程度;反之,如果进程在运行中缺页率特别低,则可适当减少分配给该进程的物理块。

何时调入页面

  1. 预调页策略(运行前调入)

根据局部性原理,一次调入若干个相邻的页面可能比一次调入一个页面更高效。可以用预测不久之后可能被访问的页面,但目前成功率只有50%。这种策略主要用于进程的首次调入,由程序员指出应该先调入哪些部分。

  1. 请求调页策略(运行时调入)

进程在运行期间发现缺页时才将所缺页面调入内存。由这种策略调入的页面一定会被访问到,但由于每次只能调入一页,而每次调页都要磁盘I/O操作,因此I/O开销较大。

何处调入页面

  1. 系统拥有足够的对换区空间

页面的调入、调出都是在内存与对换区之间进行,这样可以保证页面的调入、调出速度很快。在进程运行前,需将进程相关的数据从文件区复制到对换区。

  1. 系统缺少足够的对换区空间

凡是不会被修改的数据都直接从文件区调入,由于这些页面不会被修改,因此换出时不必写回磁盘,下次需要时再从文件区调入即可。

对于可能被修改的部分,换出时需写回磁盘对换区,下次需要时再从对换区调入。

  1. UNIX方式

运行之前进程有关的数据全部放在文件区,故未使用过的页面,都可从文件区调入。

若被使用过的页面需要换出,则写回对换区,下次需要时从对换区调入。

抖动(颠簸)现象

刚刚换出的页面马上又要换入内存,刚刚换入的页面马上又要换出外存,这种频繁的页面调度行为称为抖动,或颠簸。

产生抖动的主要原因是进程频繁访问的页面数目高于可用的物理块数(分配给进程的物理块不够)。

工作集

驻留集:指请求分页存储管理中给进程分配的内存块的集合。

工作集:指在某段时间间隔里,进程实际访问页面的集合。

操作系统会根据“窗口尺寸”来算出工作集,工作集大小可能小于窗口尺寸。

驻留集大小不能小于工作集大小,否则进程运行过程中将频繁缺页。

内存映射文件

内存映射文件是操作系统向上层程序员提供的功能(系统调用)。

  • 方便程序员访问文件数据。
  • 方便多个进程共享同一个文件。

内存映射文件是将一个文件直接映射到进程的进程空间中,这样可以通过内存指针用读写内存的办法直接存取文件内容。

“映射”就是建立一种对应关系,这里指硬盘上文件的位置与进程逻辑地址空间中一块相同区域之间一 一对应,这种关系纯属是逻辑上的概念,物理上是不存在的。

传统文件的访问方式

open系统调用——打开文件

seek系统调用——将读写指针移到某个位置

read系统调用——从读写指针所指位置读入若干数据(从磁盘读入内存)

write系统调用——将内存中的指定数据,写回磁盘(根据读写指针确定要写回什么位置)

内存映射文件的访问方式

open系统调用——打开文件

mmap系统调用——将文件映射到进程的虚拟地址空间

  • 以访问内存的方式访问文件数据
  • 文件数据的读入、写出由操作系统自动完成
  • 进程关闭文件时,操作系统自动将文件被修改的数据写回磁盘

image-20240520214340318

多个进程可以映射同一个文件,实现共享在物理内存中,一个文件对应同一份数据,当一个进程修改文件数据时,另一个进程可以立马“看到”。

虚拟存储器性能影响因素

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值