这是本人根据王道考研操作系统课程整理的笔记,希望对您有帮助。
第3章 内存管理
3.1 内存管理概念
3.1.1 内存的基础知识
内存是用于存放数据的硬件。程序执行前需要先放到内存中才能被CPU处理。
注意:通常内存中一个地址对应一个字节(1Byte = 8bit)。
例如32位电脑,能够寻 2 32 2^{32} 232个地址,每一个地址对应一个字节。又因为1G = 2 30 2^{30} 230Byte,因此32位电脑的内存上限为4G。
装入的三种方式
绝对装入:在编译时,如果知道程序将放到内存中的哪个位置,编译程序将产生绝对地址的目标代码。装入程序按照装入模块的地址,将程序和数据装入内存。(只适用于单道程序环境)
静态重定位(可重定位装入):编译、链接后的装入模块的地址都是从0开始的,指令中使用的地址、数据存放的地址都是相对于起始地址而言的逻辑地址。可根据内存的当前情况,将装入模块装入到内存的适当位置。装入时对地址进行“重定位”,将逻辑地址变换为物理地址(地址变换是在装入时一次完成的)。
动态重定位(动态运行时装入):编译、链接后的装入模块的地址都是从0开始的。装入程序把装入模块装入内存后,并不会立即把逻辑地址转换为物理地址,而是把地址转换推迟到程序真正要执行时才进行。因此装入内存后所有的地址依然是逻辑地址。这种方式需要一个重定位寄存器的支持。
链接的三种方式
静态链接:在程序运行之前,先将各目标模块及它们所需的库函数连接成一个完整的可执行文件(装入模块),之后不再拆开。
装入时动态链接:将各目标模块装入内存时,边装入边链接的链接方式。
运行时动态链接:在程序执行中需要该目标模块时,才对它进行链接。其优点是便于修改和更新,便于实现对目标模块的共享。
3.1.2 内存管理的概念
存储保护:保证各进程在自己的内存空间内运行,不会越界访问
- 设置上下限寄存器
- 利用重定位寄存器、界地址寄存器进行判断
3.1.3 覆盖与交换
覆盖技术:用来解决程序大小超过物理内存总和的问题
覆盖技术的思想:将程序分为多个段(多个模块)。常用的段常驻内存,不常用的段再需要时调入内存。
内存中分为一个“固定区”和若干个“覆盖区”。
需要常驻内存的段放在“固定区”中,调入后就不再调出(除非运行结束)
不常用的段放在“覆盖区”,需要用到时调入内存,用不到时调出内存
交换技术的设计思想:内存空间紧张时,系统将内存中某些进程暂时换出外存,把外存中某些已具备运行条件的进程换入内存(进程在内存与磁盘间动态调度)
暂时换出外存等待的进程状态为挂起状态(挂起态,suspend)
挂起态又可以进一步细分为就绪挂起、阻塞挂起两种状态
总结:
- 覆盖是在同一个程序或进程中的
- 交换是在不同进程(或作业)之间的
3.1.4 连续分配管理方式
连续分配:指为用户进程分配的必须是一个连续的内存空间。
单一连续分配:在单一连续分配方式中,内存被分为系统区和用户区。系统区通常位于内存的低地址部分,用于存放操作系统相关数据;用户区用于存放用户进程相关数据内存中只能有一道用户程序,用户程序独占整个用户区空间。
固定分区分配:将整个用户空间划分为若干个固定大小的分区,在每个分区中只装入一道作业。
操作系统需要建立一个数据结构(分区说明表),来实现各个分区的分配与回收。每个表项对应一个分区,通常按分区大小排列。每个表项包括对应分区的大小、起始地址、状态(是否已分配)。
动态分区分配(可变分区分配):这种分配方式不会预先划分内存分区,而是在进程装入内存时,根据进程的大小动态地建立分区,并使分区的大小正好适合进程的需要。
动态分区分配没有内部碎片,但是有外部碎片。
内部碎片:分配给某进程的内存区域中,如果有些部分没有用上。
外部碎片:是指内存中的某些空闲分区由于太小而难以利用。
外部碎片可以用“紧凑”技术来解决。
回收内存分区时,可能遇到四种情况:
- 回收区之后有相邻的空闲分区
- 回收区之前有相邻的空闲分区
- 回收区前、后都有相邻的空闲分区
- 回收区前、后都没有相邻的空闲分区
3.1.5 动态分区分配算法
动态分区分配算法:在动态分区分配方式中,当很多个空闲分区都能满足需求时,应该选择哪个分区进行分配?
首次适应算法:每次都从低地址开始查找,找到第一个能满足大小的空闲分区
空闲分区以地址递增的次序排列。每次分配内存时顺序查找空闲分区链(或空闲分区表),找到大小能满足要求的第一个空闲分区。
最佳适应算法:由于动态分区分配是一种连续分配方式,为各进程分配的空间必须是连续的一整片区域。因此为了保证当“大进程”到来时能有连续的大片空间,可以尽可能多地留下大片的空闲区,即,优先使用更小的空闲区。
空闲分区按容量递增次序链接。每次分配内存时顺序查找空闲分区链(或空闲分区表),找到大小能满足要求的第一个空闲分区。
最坏(大)适应算法:为了解决最佳适应算法的问题一一即留下太多难以利用的小碎片,可以在每次分配时优先使用最大的连续空闲区,这样分配后剩余的空闲区就不会太小,更方便使用。
空闲分区按容量递减次序链接。每次分配内存时顺序查找空闲分区链(或空闲分区表),找到大小能满足要求的第一个空闲分区。
邻近适应算法:首次适应算法每次都从链头开始查找的。这可能会导致低地址部分出现很多小的空闲分区,而每次分配查找时,都要经过这些分区,因此也增加了查找的开销。如果每次都从上次查找结束的位置开始检索,就能解决上述问题。
空闲分区以地址递增的顺序排列(可排成一个循环链表)。每次分配内存时从上次查找结束的位置开始查找空闲分区链(或空闲分区表),找到大小能满足要求的第一个空闲分区。
3.1.6 基本分页存储管理的基本概念
将内存空间分为一个个大小相等的分区(比如:每个分区4KB),每个分区就是一个页框 / 页帧 / 内存块 / 物理块。每个页框有一个编号,即页框号 / 内存块号 / 页帧号 / 物理块号,页框号从0开始。
将用户进程的地址空间也分为与页框大小相等的一个个区域,称为页面。每个页面也有一个编号,即页号,页号也是从0开始。
操作系统以页框为单位为各个进程分配内存空间。进程的每个页面分别放入一个页框中。也就是说,进程的页面与内存的页框有一一对应的关系。
逻辑地址结构
假设内存地址长度为32位,分页存储管理的逻辑地址结构如下所示:
- 如果有 K K K位表示“页内偏移量”,则说明该系统中,一个页面的大小是 2 K 2^K 2K个内存单元
- 如果有 M M M位表示“页号”,则说明在该系统中,一个进程最多允许有 2 M 2^M 2M个页面
页表
为了能知道进程的每个页面在内存中存放的位置,操作系统要为每个进程建立一张页表。
- 一个进程对应一张页表
- 进程的每一页对应一个页表项
- 每个页表项由“页号”和“块号”组成
- 页表记录进程页面和实际存放的内存块之间的对应关系
各页表项会按顺序连续地存放在内存中,页表中的“页号”可以是“隐含”的。只需要知道页表存放的起始地址和页表项长度,即可找到各个页号对应的页表项存放的位置。
3.1.7 基本地址变换机构
基本地址变换机构:借助进程的页表将逻辑地址转换为物理地址。
通常会在系统中设置一个页表寄存器 (PTR),存放页表在内存中的起始地址 F 和页表长度 M。进程未执行时,页表的始址和页表长度放在进程控制块 (PCB) 中,当进程被调度时,操作系统内核会把它们放到页表寄存器中。
假设某系统物理内存大小为4GB,页面大小为4KB,内存总共会被分为 2 32 / 2 12 = 2 20 2^{32}/2^{12}=2^{20} 232/212=220个内存块。
理论上,页表项长度为3B即可表示内存块号的范围,但是,为了方便页表的查询,常常会让一个页表项占更多的字节,使得每个页面恰好可以装得下整数个页表项。
3.1.8 具有快表的地址变换机构
时间局部性:如果执行了程序中的某条指令,那么不久后这条指令很有可能再次执行;如果某个数据被访问过,不久之后该数据很可能再次被访问。(因为程序中存在大量的循环)
空间局部性:一旦程序访问了某个存储单元,在不久之后,其附近的存储单元也很有可能被访问。(因为很多数据在内存中都是连续存放的)
快表,又称联想寄存器(TLB),是一种访问速度比内存快很多的高速缓冲存储器,用来存放当前访问的若干页表项,以加速地址变换的过程。与此对应,内存中的页表常称为慢表。
基本地址变换机构VS具有快表的地址变换机构
3.1.9 两级页表
问题一:页表必须连续存放,因此当页表很大时,需要占用很多个连续的页框。
问题二:没有必要让整个页表常驻内存,因为进程在一段时间内可能只需要访问某几个特定的页面。
两级页表结构的逻辑地址结构:
注意:
- 若采用多级页表机制,则各级页表的大小不能超过一个页面。
- 多级页表的访存次数(假设没有快表机构):N级页表访问一个逻辑地址需要N+1次访存。
3.1.10 基本分段存储管理方式
与“分页”最大的区别是:离散分配时所分配地址空间的基本单位不同
分段
进程的地址空间:按照程序自身的逻辑关系划分为若干个段,每个段都有一个段名(在低级语言中,程序员使用段名来编程),每段从0开始编址。
内存分配规则:以段位单位进行分配,每个段在内存中占据连续空间,但各段之间可以不相邻。
分段系统的逻辑地址结构由段号(段名)和段内地址(段内偏移量)所组成:
段表
注意:各个段表项的长度是相同的。因此短号可以是隐含的,不占存储空间。
地址变换
分段、分页管理的对比
页是信息的物理单位。分页的主要目的是为了实现离散分配,提高内存利用率。分页仅仅是系统管理上的需要,完全是系统行为,对用户是不可见的。
段是信息的逻辑单位。分段的主要目的是更好地满足用户需求。一个段通常包含着一组属于一个逻辑模块的信息。分段对用户是可见的,用户编程时需要显式地给出段名。
页的大小固定且由系统决定。
段的长度不固定,决定于用户编写的程序。
分页的用户进程地址空间是一维的,程序员只需给出一个记忆符即可表示一个地址。
分段的用户进程地址空间是二维的,程序员在标识一个地址时,既要给出段名,也要给出段内地址。
分段比分页更容易实现信息的共享和保护。不能被修改的代码称为纯代码或可重入代码(不属于临界资源),这样的代码是可以共享的。可修改的代码是不能共享的
3.1.11 段页式管理方式
将进程按逻辑模块分段,再将各段分页(如每个页面4KB)
将内存空间分为大小相同的内存块/页框/页帧/物理块,并将各页面分别装入各内存块中
段页式系统的逻辑地址结构由段号、页号、页内地址(页内偏移量)组成:
3.2 虚拟系统管理
3.2.1 虚拟内存的基本概念
传统存储管理方式的特征、缺点
一次性:作业数据必须一次全部调入内存
驻留性:作业数据在整个运行期间都会常驻内存
局部性原理
时间局部性:现在访问的指令、数据在不久后很可能会被再次访问
空间局部性:现在访问的内存单元周围的内存空间,很可能在不久后会被访问
高速缓存技术:使用频繁的数据放到更高速的存储器中
虚拟内存的定义和特征
程序不需全部装入即可运行,运行时根据需要动态调入数据,若内存不够,还需要换出一些数据
多次性:无需在作业运行性全部装入内存,而是允许被分成多次调入内存。
对换性:无需在作业运行时一直常驻内存,而是允许在作业运行过程中,将作业换入、换出。
虚拟性:从逻辑上扩充了内存的容量,使用户看到的内存容量,远大于实际的容量。
如何实现虚拟内存技术
访问的信息不在内存时,由操作系统负责将所需信息从外存调入内存(请求调页功能)
内存空间不够时,将内存中暂时用不到的信息换出到外存 (页面置换功能)
虚拟内存的实现
- 请求分页存储管理
- 请求分段存储管理
- 请求段页式存储管理
3.2.2 请求分页管理方式
请求分页存储管理与基本分页存储管理的主要区别:
在程序执行过程中,当所访问的信息不在内存时,由操作系统负责将所需信息从外存调入内存,然后继续执行程序。
若内存空间不够,由操作系统负责将内存中暂时用不到的信息换出到外存。
页表机制
在基本分页的基础上增加了几个表项:
- 状态位:表示页面是否已在内存中
- 访问字段:记录最近被访问过几次,或记录上次访问的时间,供置换算法选择换出页面时参考
- 修改位:表示页面调入内存后是否被修改过,只有修改过的页面才需在置换时写回外存
- 外存地址:页面在外存中存放的位置
缺页中断机构
找到页表项后检查页面是否已在内存,若没在内存,产生缺页中断。
缺页中断处理中,需要将目标页面调入内存,有必要时还要换出页面
缺页中断属于内中断中的"故障",即可能被系统修复的异常
一条指令在执行过程中可能产生多次缺页中断
地址变换机构
找到页表项需要检查页面是否在内存中。若页面不再内存中,需要请求调页;若内存空间不够,还需换出页面。
在基本分页地址变换机构的基础上增加了几个步骤:
- 请求调页:查到页表项时进行判断
- 页面置换:需要调入页面,但没有空闲内存块时进行
- 页面调入内存后,需要修改相应页表项
快表中有的页面一定是在内存中的。若某个页面被换出外存,则快表中的相应表项也要删除,否则可能访问错误的页面。
3.2.3 页面置换算法
页面的换入、换出需要磁盘I/O,会有较大的开销,因此好的页面置换算法应该追求更少的缺页率。
最佳置换算法(OPT)
每次选择淘汰的页面将是以后永不使用,或者在最长时间内不再被访问的页面,这样可以保证最低的缺页率。
最佳置换算法可以保证最低的缺页率,但实际上,只有在进程执行的过程中才能知道接下来会访问到的是哪个页面。操作系统无法提前预判页面访问序列。因此,最佳置换算法是无法实现的。
先进先出置换算法(FIFO)
每次选择淘汰的页面是最早进入内存的页面。
实现方法:把调入内存的页面根据调入的先后顺序排成一个队列,需要换出页面时选择队头页面即可。队列的最大长度取决于系统为进程分配了多少个内存块。
Blendy异常:当为进程分配的物理块数增大时,缺页次数不减反增的异常现象。
只有FIFO算法会产生Belady异常。另外,FIFO算法虽然实现简单,但是该算法与进程实际运行时的规律不适应,因为先进入的页面也有可能最经常被访问。因此,算法性能差。
最近最久未使用置换算法(LRU)
每次淘汰的页面是最近最久未使用的页面。
实现方法:赋予每个页面对应的页表项中,用访问字段记录该页面自上次被访问以来所经历的时间
t
t
t。当需要淘汰一个页面时,选择现有页面中
t
t
t 值最大的,即最近最久未使用的页面。
时钟置换算法(CLOCK)或最近未用算法(NRU)
实现方法:为每个页面设置一个访问位,再将内存中的页面都通过链接指针链接成一个循环队列。当某页被访问时,其访问位置为1。当需要淘汰一个页面时,只需检查页的访问位。如果是0,就选择该页换出:如果是1,则将它置为0,暂不换出,继续检查下一个页面,若第一轮扫描中所有页面都是1,则将这些页面的访问位依次置为0后,再进行第二轮扫描(第二轮扫描中一定会有访问位为0的页面,因此简单的CLOCK算法选择一个淘汰页面最多会经过两轮扫描)
改进型的时钟置换算法
简单的时钟置换算法仅考虑到一个页面最近是否被访问过。事实上,如果被淘汰的页面没有被修改过,就不需要执行/O操作写回外存。只有被淘汰的页面被修改过时,才需要写回外存。
因此,除了考虑一个页面最近有没有被访问过之外,操作系统还应考虑页面有没有被修改过。在其他条件都相同时,应优先淘汰没有修改过的页面,避免I/O操作。这就是改进型的时钟置换算法的思想。
第一优先级:最近没访问,且没修改的页面
第二优先级:最近没访问,但修改过的页面
第三优先级:最近访问过,但没修改的页面
第四优先级:最近访问过,且修改过的页面
总结
3.2.4 页面分配策略
驻留集
请求分页存储管理中给进程分配的物理块的集合。
在采用了虚拟存储技术的系统中,驻留集大小一般小于进程的总大小。
若驻留集太小,会导致缺页频繁,系统要花大量的时间来处理缺页,实际用于进程推进的时间很少
若驻留集太大,又会导致多道程序并发度下降,资源利用率降低。所以应该选择一个合适的驻留集大小。
-
固定分配:操作系统为每个进程分配一组固定数目的物理块,在进程运行期间不再改变。即,驻留集大小不变
-
可变分配:先为每个进程分配一定数目的物理块,在进程运行期间,可根据情况做适当的增加或减少。即,驻留集大小可变
-
局部置换:发生缺页时只能选进程自己的物理块进行置换。
-
全局置换:可以将操作系统保留的空闲物理块分配给缺页进程,也可以将别的进程持有的物理块置换到外存,再分配给缺页进程。
工作集
指在某段时间间隔里,进程实际访问页面的集合。
一般来说,驻留集大小不能小于工作集大小,否则进程运行过程中将频繁缺页。
何时调入页面
预调页策略:根据(空间)局部性原理,一次调入若干个相邻的页面可能比一次调入一个页面更高效。但如果提前调入的页面中大多数都没被访问过,则又是低效的。因此可以预测不久之后可能访问到的页面,将它们预先调入内存,但目前预测成功率只有50%左右。故这种策略主要用于进程的首次调入,由程序员指出应该先调入哪些部分。
请求调页策略:进程在运行期间发现缺页时才将所缺页面调入内存。由这种策略调入的页面一定会被访问到,但由于每次只能调入一页,而每次调页都要磁盘I/O操作,因此I/O开销较大。
从何处调页
对换区:采用连续存储方式,速度更快
文件区:采用离散存储方式,速度更慢
对换区足够大:运行将数据从文件区复制到对换区,之和所有的页面调入、调出都是在内存与对换区之间进行
对换区不够大:不会修改的数据每次都从文件区调入;会修改的数据调出到对换区,需要时再从对换区调入
Unix方式:第一次使用的页面都从文件区调入;调出的页面都写回对换区,再次使用时从对换区调入
抖动(颠簸)现象
刚刚换出的页面马上又要换入内存,刚刚换入的页面马上又要换出外存,这种频繁的页面调度行为称为抖动,或颠簸。
产生抖动的主要原因是进程频繁访问的页面数目高于可用的物理块数(分配给进程的物理块不够)