3.1 内存管理的概念
3.1.1 什么是内存?
进程的基本原理,深入指令理解其过程
3.1.1.1 总览
3.1.1.2 什么是内存?有何作用?
(1)存储单元
关于存储单元有关内容在我写的组成原理笔记中有提到:存储单元
内存可存放数据。程序执行前需要先放到内存中才能被CPU处理——缓和CPU与硬盘之间的速度矛盾
(2)几个常用数量单位&内存地址
3.1.1.3 进程运行的基本原理
(1)指令的工作原理——操作码+若干参数(可能包含地址参数)
- 从X=X+1大致看一下指令的执行过程
(2)逻辑地址(相对地址)vs物理地址(绝对地址)
(3)从写程序到程序运行——编译、链接、装入
编译:由编译程序
将用户源代码编译成若干个目标模块(编译就是把高级语言翻译为机器语言)
链接:由链接程序
将编译后形成的一组目标模块,以及所需库函数链接在一起,形成一个完整的装入模块
装入(装载):由装入程序
将装入模块装入内存运行
(4)装入模块装入内存
不修改装入模块中的指令地址就直接装入内存的话:
(5)装入的三种方式
- 绝对装入
绝对装入:在编译时,如果知道程序将放到内存中的哪个位置,编译程序将产生绝对地址的目标代码。
装入程序按照装入模块中的地址,将程序和数据装入内存。
- 静态重定位
静态重定位:又称可重定位装入
。编译、链接后的装入模块的地址都是从0开始的,指令中使用的地址、数据存放的地址都是相对于起始地址而言的逻辑地址。可根据内存的当前情况,将装入模块装入到内存的适当位置。装入时对地址进行“重定位”,将逻辑地址变换为物理地址(地址变换是在装入时一次完成的)。
- 动态重定位
动态重定位:又称动态运行时装入
。编译、链接后的装入模块的地址都是从0开始的。装入程序把装入模块装入内存后,并不会立即把逻辑地址转换为物理地址,而是把地址转换推迟到程序真正要执行时才进行。因此装入内存后所有的地址依然是逻辑地址。这种方式需要一个重定位寄存器的支持。
(6)链接的三种方式
- 静态链接
在程序运行之前,先将各目标模块及它们所需的库函数连接成一个完整的可执行文件(装入模块),之后不再拆开。
- 装入时动态链接
将各目标模块装入内存时,边装入边链接的链接方式。
- 运行时动态链接
在程序执行中需要该目标模块时,才对它进行链接。其优点是便于修改和更新,便于实现对目标模块的共享。
3.1.2 内存管理管些什么?
3.1.2.1 总览
3.1.2.2 内存空间的分配与回收
3.1.2.3 内存空间的扩展(实现虚拟性)
3.1.2.4 地址转换
- 三种方式
3.1.2.5 内存保护
- 两种方式
3.1.3 覆盖技术与交换技术的思想
3.1.3.1 总览
3.1.3.2 覆盖技术
后来人们引入了覆盖技术,用来解决“程序大小超过物理内存总和”的问题
覆盖技术的思想:将程序分为多个段(多个模块)。常用的段常驻内存,不常用的段在需要时调入内存。
内存中分为一个“固定区”和若干个“覆盖区”
需要常驻内存的段放在“固定区”中,调入后就不再调出(除非运行结束)
不常用的段放在“覆盖区”,需要用到时调入内存,用不到时调出内存
必须由程序员声明覆盖结构,操作系统完成自动覆盖。缺点:对用户不透明,增加了用户编程负担。
覆盖技术只用于早期的操作系统中,现在已成为历史。
3.1.3.3 交换技术
交换(对换)技术的设计思想:内存空间紧张时,系统将内存中某些进程暂时换出外存,把外存中某些已具备运行条件的进程换入内存(进程在内存与磁盘间动态调度)
- 回忆复习一下进程调度
1.具有对换功能的操作系统中,通常把磁盘空间分为文件区
和对换区
两部分。文件区主要用于存放文件,主要追求存储空间的利用率,因此对文件区空间的管理采用离散分配方式;对换区空间只占磁盘空间的小部分,被换出的进程数据就存放在对换区。由于对换的速度直接影响到系统的整体速度,因此对换区空间的管理主要追求换入换出速度,因此通常对换区采用连续分配方式(学过文件管理章节后即可理解)。总之,对换区的I/O速度比文件区的更快。
2.交换通常在许多进程运行且内存吃紧时进行,而系统负荷降低就暂停。例如:在发现许多进程运行时经常发生缺页,就说明内存紧张,此时可以换出一些进程;如果缺页率明显下降,就可以暂停换出。
3.可优先换出阻塞进程;可换出优先级低的进程;为了防止优先级低的进程在被调入内存后很快又被换出,有的系统还会考虑进程在内存的驻留时间…
(注意:PCB会常驻内存,不会被换出外存)
3.1.4 内存的分配与回收
3.1.4.1 总览
3.1.4.2 单一连续分配
在单一连续分配方式中,内存被分为系统区
和用户区
。系统区
通常位于内存的低地址部分,用于存放操作系统相关数据;用户区
用于存放用户进程相关数据。
内存中只能有一道用户程序,用户程序独占整个用户区空间。
优点:实现简单;无外部碎片;可以采用覆盖技术扩充内存;不一定需要采取内存保护(eg:早期的PC操作系统MS-DOS)。
缺点:只能用于单用户、单任务的操作系统中;有内部碎片;存储器利用率极低。
分配给某进程的内存区域中,如果有些部分没有用上,就是“内部碎片”
3.1.4.3 固定分区分配
(1)分区说明表
操作系统需要建立一个数据结构——分区说明表,来实现各个分区的分配与回收。每个表项对应一个分区,通常按分区大小排列。每个表项包括对应分区的大小、起始地址、状态(是否已分配)。
优点:简单,无外部碎片。
缺点:a.当用户程序太大时,可能所有的分区都不能满足需求,此时不得不采用覆盖技术来解决,但这又会降低性能;b.会产生内部碎片,内存利用率低。
3.1.4.4 动态分区分配(可变分区分配)
动态分区分配又称为可变分区分配
。这种分配方式不会预先划分内存分区,而是在进程装入内存时,根据进程的大小动态地建立分区,并使分区的大小正好适合进程的需要。因此系统分区的大小和数目是可变的。(eg:假设某计算机内存大小为64MB,系统区8MB,用户区共56 MB.…)
(1)系统要用怎样的数据结构记录内存的使用情况呢?
空闲分区表:每个空闲分区对应一个表项。表项中包含分区号分区大小、分区起始地址等信息
空闲分区链:每个分区的起始部分和末尾部分分别设置前向指针和后向指针。起始部分处还可记录分区大小等信息
(2)当多个空闲分区都能满足要求时,应该选择哪个分区进行分配?
(3)如何进行分区的分配和回收操作?
如何分配?
如何回收?
3.1.4.5 内部碎片与外部碎片
外部碎片,是指内存中的某些空闲分区由于太小而难以利用
3.1.5 动态分区分配的四种算法
本篇文章是对上一篇文章[内存的分配与回收](#3.1.4 内存的分配与回收)提到的动态分区分配算法
的补充
- 首次适应算法
- 最佳适应算法
- 最坏适应算法
- 临近适应算法
3.1.5.1 总览
3.1.5.2 首次适应算法
3.1.5.3 最佳适应算法
3.1.5.4 最坏(大)适应算法
3.1.5.5 临近适应算法
3.1.5.6 四种算法归纳比较
3.1.6 分页存储(页号、页偏移量等)
3.1.6.1 总览
3.1.6.2 为什么学习分页存储?
3.1.6.3 基本分页存储管理的思想
基本分页存储管理的思想——把内存分为一个个相等的小分区,再按照分区大小把进程拆分成一个个小部分,显然,如果把分区大小设置的越小一些,内部碎片会更小,内存利用率会更高。
3.1.6.4 分页存储管理的重要概念
将内存空间分为一个个大小相等的分区(比如:每个分区4KB),每个分区就是一个“页框”,或称“页帧”、“内存块”、“物理块”。每个页框有一个编号,即“页框号”(或者“内存块号”、“页帧号”、“物理块号”)页框号从0开始。
将用户进程的地址空间也分为与页框大小相等的一个个区域,称为“页”或“页面”。每个页面也有一个编号,即“页号”,页号也是从0开始。
(注:进程的最后一个页面可能没有一个页框那么大。因此,页框不能太大,否则可能产生过大的内部碎片)
操作系统以页框为单位为各个进程分配内存空间,进程的每个页面分别放入一个页框中,也就是说,进程的页面
与内存的页框
有一一对应的关系。
各个页面不必连续存放,也不必按先后顺序来,可以放到不相邻的各个页框中。
3.1.6.5 如何实现地址的转换
(1)如何计算页号和页偏移量
为了方便计算页号、页内偏移量,页面大小一般设为2的整数幂
页号 = 逻辑地址 / 页面长度(取除法的整数部分)
页内偏移量 = 逻辑地址 % 页面长度(取除法的余数部分)
页面在内存中的起始位置:操作系统需要用某种数据结构记录进程各个页面的起始位置。
为什么页面大小一般设为2的整数次幂?
结论:如果每个页面大小为2^k
B,用二进制数表示逻辑地址,则末尾K位即为页内偏移量,其余部分就是页号
因此,如果让每个页面的大小为2的整数幂,计算机就可以很方便地得出一个逻辑地址对应的页号和页内偏移量
(2)分页存储的逻辑结构
地址结构包含两个部分:前一部分为页号,后一部分为页内偏移量W
如果有K位表示“页内偏移量”,则说明该系统中一个页面的大小是2^K
个内存单元
如果有M位表示“页号”,则说明在该系统中,一个进程最多允许有2^M
个页面
(3)如何知道页面在内存中的起始地址?
- 这里引入一个新的概念:
页表
为了能知道进程的每个页面在内存中存放的位置,操作系统要为每个进程建立一张页表。
3.1.7 分页存储管理的基本地址变换结构
3.1.7.1 总览
3.1.7.2 页表寄存器
基本地址变换机构可以借助进程的页表将逻辑地址转换为物理地址。
通常会在系统中设置一个页表寄存器
(PTR),存放页表在内存中的起始地址F和页表长度M。
进程未执行时,页表的始址
和页表长度
放在进程控制块(PCB) 中,当进程被调度时,操作系统内核会把它们放到页表寄存器中。
- 地址变换过程
程序计数器PC:指向下一条指令的逻辑地址A
设页面大小为L,逻辑地址A到物理地址E的变换过程如下:
①计算页号Р和页内偏移量W(如果用十进制数手算,则P = A / L,W = A % L;但是在计算机实际运行时,逻辑地址结构是固定不变的,因此计算机硬件可以更快地得到二进制表示的页号、页内偏移量)
②比较页号P和页表长度M,若P >= M,则产生越界中断,否则继续执行。(注意页号是从0开始的,而页表长度至少是1,因此P = M时也会越界)
③页表中页号P对应的页表项地址 = 页表起始地址F + 页号P * 页表项长度,取出该页表项内容b,即为内存块号。(注意区分页表项长度、页表长度、页面大小的区别。页表长度指的是这个页表中总共有几个页表项,即总共有几个页;页表项长度指的是每个页表项占多大的存储空间;页面大小指的是一个页面占多大的存储空间)
④计算E = b * L + W,用得到的物理地址E去访存。(如果内存块号、页面偏移量是用二进制表示的,那么把二者拼接起来就是最终的物理地址了)
一道例题加深印象:
3.1.7.3 对页表项大小的进一步讨论
3.1.8 快表的地址变换结构
上一篇文章学习了[分页存储管理的基本地址变换结构](#3.1.7 分页存储管理的基本地址变换结构),这一篇文章是对基本地址变换结构的改进版。
3.1.8.1 总览
3.1.8.2 局部性原理引入快表机制
上小节介绍的基本地址变换机构中,每次要访问一个逻辑地址,都需要查询内存中的页表。由于局部性原理,可能连续很多次查到的都是同一个页表项。既然如此,能否利用这个特性减少访问页表的次数呢?——快表机制
时间局部性:如果执行了程序中的某条指令,那么不久后这条指令很有可能再次执行;如果某个数据被访问过,不久之后该数据很可能再次被访问。(因为程序中存在大量的循环)
空间局部性:一旦程序访问了某个存储单元,在不久之后,其附近的存储单元也很有可能被访问。(因为很多数据在内存中都是连续存放的)
3.1.8.3 快表(TLB)
一个例图了解基于快表的地址变换结构
引入快表后,地址变换的过程的文字描述:
3.1.8.4 基本地址变换与快表地址变换的比较
3.1.9 二级页表的原理和地址结构
3.1.9.1 总览
3.1.9.2 为什么引入二级页表?
因为单级页表存在一些问题,所以引入二级页表和多级页表,有两个问题:
上面提到了这两个问题,那么总结一下,并提出解决思想,引入二级页表的概念。
发现问题——》提出方法——》解决问题
3.1.9.3 二级页表的原理和地址结构
- 对页表再次分组
- 二级页表的地址结构及对应关系
3.1.9.4 如何实现二级页表的地址变换?
上面的部分我们解决了问题一,接下来是问题二,这里简单叙述一下,后面的文章会继续深入剖析。
3.1.9.5 几个小细节
3.1.10 基本分段存储管理(段表、地址变换、信息共享)
3.1.10.1 总览
3.1.10.2 什么是分段?
- 分段的逻辑地址结构