操作系统——内存管理、分页、分段、段页式存储管理

最新推荐文章于 2025-03-23 14:11:30 发布

易安__

最新推荐文章于 2025-03-23 14:11:30 发布

阅读量2.3k

点赞数 6

分类专栏：操作系统文章标签：开发语言 linux

本文链接：https://blog.csdn.net/saber520___/article/details/132921668

版权

操作系统专栏收录该内容

5 篇文章

订阅专栏

内存的基础知识

在这里插入图片描述

什么是内存

内存是用于存放数据的硬件。程序执行前需要先放到内存中才能被cPU处理。
内存地址从0开始，每个地址对应一个存储单元
如果计算机**“按字节编址”则每个存储单元大小为1字节，即1B**，即8个二进制位
如果字长为16位的计算机**“按字编址”，则每个存储单元大小为1个字;每个字的大小为16个二进制位**
相对地址又称逻辑地址，绝对地址又称物理地址。

从写程序到程序运行

编译:由编译程序将用户源代码编译成若干个目标模块（编译就是把高级语言翻译为机器语言)
链接:由链接程序将编译后形成的一组目标模块，以及所需库函数链接在一起，形成一个完整的装入模块
装入（装载）:由装入程序将装入模块装入内存运行
装入的三种方式（用三种不同的方法完成逻辑地址到物理地址的转换）:
- 1．绝对装入
- 2．静态重定位
- 3．动态重定位

绝对装入

**绝对装入:**在编译时，如果知道程序将放到内存中的哪个位置，编译程序将产生绝对地址的目标代码。装入程序按照装入模块中的地址，将程序和数据装入内存。
绝对装入只适用于单道程序环境。
程序中使用的绝对地址，可在编译或汇编时给出，也可由程序员直接赋予。通常情况下都是编译或汇编时再转换为绝对地址。

静态重定位

静态重定位:又称可重定位装入。编译、链接后的装入模块的地址都是从0开始的，指令中使用的地址、数据存放的地址都是相对于起始地址而言的逻辑地址。可根据内存的当前情况，将装入模块装入到内存的适当位置。装入时对地址进行**“重定位”**，将逻辑地址变换为物理地址（地址变换是在装入时一次完成的）。
静态重定位的特点是在一个作业装入内存时，**必须分配其要求的全部内存空间，**如果没有足够的内存，就不能装入该作业。作业一旦进入内存后，在运行期间就不能再移动，也不能再申请内存空间。

动态重定位

动态重定位:又称动态运行时装入。编译、链接后的装入模块的地址都是从o开始的。装入程序把装入模块装入内存后，并不会立即把逻辑地址转换为物理地址，而是把地址转换推迟到程序真正要执行时才进行。因此装入内存后所有的地址依然是逻辑地址。这种方式需要一个重定位寄存器的支持。

链接的三种方式

链接的三种方式:
- 1.静态链接:在程序运行之前,先将各目标模块及它们所需的库函数连接成一个完整的可执行文件（装入模块）﹐之后不再拆开。
- 2.装入时动态链接:将各目标模块装入内存时，边装入边链接的链接方式。
- 3.运行时动态链接:在程序执行中需要该目标模块时，才对它进行链接。其优点是便于修改和更新，便于实现对目标模块的共享。

总结

内存管理的概念

1.操作系统负责内存空间的分配与回收
2.操作系统需要提供某种技术从逻辑上对内存空间进行扩充
3.操作系统需要提供地址转换功能，负责程序的逻辑地址与物理地址的转换
4.操作系统需要提供内存保护功能。保证各进程在各自存储空间内运行，互不干扰
- 方法一:在cpu中设置一对上、下限寄存器，存放进程的上、下限地址。进程的指令要访问某个地址时，CPU检查是否越界。
- 方法二:采用重定位寄存器（又称基址寄存器）和界地址寄存器（又称限长寄存器）进行越界检查。重定位寄存器中存放的是进程的起始物理地址。界地址寄存器中存放的是进程的最大逻辑地址。

总结

覆盖与交换

覆盖技术

覆盖技术的思想:将程序分为多个段（多个模块）。常用的段常驻内存，不常用的段在需要时调入内存。
内存中分为一个“固定区”和若干个“覆盖区”。
需要常驻内存的段放在**“固定区”**中，调入后就不再调出（除非运行结束)
不常用的段放在**“覆盖区”**，需要用到时调入内存，用不到时调出内存
必须由程序员声明覆盖结构，操作系统完成自动覆盖。
缺点:对用户不透明,增加了用户编程负担。覆盖技术只用于早期的操作系统中，现在已成为历史。

交换技术

交换（对换）技术的设计思想:内存空间紧张时，系统将内存中某些进程暂时换出外存，把外存中某些已具备运行条件的进程换入内存（进程在内存与磁盘间动态调度)
暂时换出外存等待的进程状态为挂起状态（挂起态，suspend)
挂起态又可以进一步细分为就绪挂起、阻塞挂起两种状态
1．具有对换功能的操作系统中，通常把磁盘空间分为文件区和对换区两部分。文件区主要用于存放文件，主要追求存储空间的利用率，因此对文件区空间的管理采用离散分配方式;对换区空间只占磁盘空间的小部分，被换出的进程数据就存放在对换区。由于对换的速度直接影响到系统的整体速度，因此对换区空间的管理主要追求换入换出速度，因此通常对换区采用连续分配方式（学过文件管理章节后即可理解）。总之，对换区的I/o速度比文件区的更快。
2．交换通常在许多进程运行且内存吃紧时进行，而系统负荷降低就暂停。例如:在发现许多进程运行时经常发生缺页，就说明内存紧张，此时可以换出一些进程;如果缺页率明显下降，就可以暂停换出。
3.可优先换出阻塞进程;可换出优先级低的进程;为了防止优先级低的进程在被调入内存后很快又被换出，有的系统还会考虑进程在内存的驻留时间..(注意:PCB会常驻内存，不会被换出外存)

总结

连续分配管理方式

单一连续分配

连续分配:指为用户进程分配的必须是一个连续的内存空间。
在单一连续分配方式中，内存被分为系统区和用户区。系统区通常位于内存的低地址部分，用于存放操作系统相关数据;用户区用于存放用户进程相关数据。内存中只能有一道用户程序，用户程序独占整个用户区空间。
优点:实现简单;无外部碎片;可以采用覆盖技术扩充内存;不一定需要采取内存保护（eg:早期的PC操作系统MS-DOS) 。
缺点:只能用于单用户、单任务的操作系统中;**有内部碎片;**存储器利用率极低。

固定分区分配

20世纪60年代出现了支持多道程序的系统，为了能在内存中装入多道程序，且这些程序之间又不会相互干扰，于是将整个用户空间划分为若干个固定大小的分区，在每个分区中只装入一道作业，这样就形成了最早的、最简单的一种可运行多道程序的内存管理方式。
- 分区大小相等
- 分区大小不等

操作系统需要建立一个数据结构――分区说明表，来实现各个分区的分配与回收。每个表项对应一个分区，通常按分区大小排列。每个表项包括对应分区的大小、起始地址、状态（是否已分配）。

优点:实现简单，无外部碎片。
缺点:
- a.当用户程序太大时，可能所有的分区都不能满足需求，此时不得不采用覆盖技术来解决，但这又会降低性能;
- b**.会产生内部碎片**，内存利用率低。

动态分区分配

动态分区分配又称为可变分区分配。这种分配方式不会预先划分内存分区，而是在进程装入内存时,根据进程的大小动态地建立分区，并使分区的大小正好适合进程的需要。因此系统分区的大小和数目是可变的。(eg:假设某计算机内存大小为64MB，系统区8MB，用户区共56 MB.….)
动态分区分配没有内部碎片，但是有外部碎片。
- 内部碎片，分配给某进程的内存区域中，如果有些部分没有用上。
- 外部碎片，是指内存中的某些空闲分区由于太小而难以利用。
- 如果内存中空闲空间的总和本来可以满足某进程的要求，但由于进程需要的是一整块连续的内存空间，因此这些“碎片”不能满足进程的需求。可以通过紧凑（拼凑，Compaction）技术来解决外部碎片。

把一个新作业装入内存时，须按照一定的动态分区分配算法，从空闲分区表（或空闲分区链）中选出一个分区分配给该作业。由于分配算法算法对系统性能有很大的影响，因此人们对它进行了广泛的研究。

总结

动态分区分配算法

首次适应算法

算法思想:每次都从低地址开始查找，找到第一个能满足大小的空闲分区。
如何实现:空闲分区以地址递增的次序排列。每次分配内存时顺序查找空闲分区链（或空闲分区表)，找到大小能满足要求的第一个空闲分区。

最佳适应算法

算法思想:由于动态分区分配是一种连续分配方式，为各进程分配的空间必须是连续的一整片区域。因此为了保证当“大进程”到来时能有连续的大片空间，可以尽可能多地留下大片的空闲区，即，优先使用更小的空闲区。
如何实现:空闲分区按容量递增次序链接。每次分配内存时顺序查找空闲分区链(或空闲分区表），找到大小能满足要求的第一个空闲分区。
**缺点:**每次都选最小的分区进行分配，会留下越来越多的、很小的、难以利用的内存块。因此这种方法会产生很多的外部碎片。

最坏（大）适应算法

又称最大适应算法(Largest Fit)
算法思想:为了解决最佳适应算法的问题――即留下太多难以利用的小碎片，可以在每次分配时优先使用最大的连续空闲区，这样分配后剩余的空闲区就不会太小，更方便使用。
如何实现:空闲分区按容量递减次序链接。每次分配内存时顺序查找空闲分区链（或空闲分区表），找到大小能满足要求的第一个空闲分区。
**缺点:**每次都选最大的分区进行分配，虽然可以让分配后留下的空闲区更大，更可用，但是这种方式会导致较大的连续空闲区被迅速用完。如果之后有“大进程”到达，就没有内存分区可用了。

邻近适应算法

算法思想:首次适应算法每次都从链头开始查找的。这可能会导致低地址部分出现很多小的空闲分区，而每次分配查找时，都要经过这些分区，因此也增加了查找的开销。如果每次都从上次查找结束的位置开始检索，就能解决上述问题。
如何实现:空闲分区以地址递增的顺序排列（可排成一个循环链表)）。每次分配内存时从上次查找结束的位置开始查找空闲分区链（或空闲分区表)，找到大小能满足要求的第一个空闲分区。

总结

基本分页存储管理的基本概念

基本概念

将内存空间分为一个个大小相等的分区（比如:每个分区4KB），每个分区就是一个**“页框”，或称“页帧”、“内存块”、“物理块”。每个页框有一个编号，即“页框号”(或者“内存块号”、“页帧号”、“物理块号”)页框号从o开始。**
将用户进程的地址空间也分为与页框大小相等的一个个区域，称为“页”或“页面”。每个页面也有一个编号，即“页号”，页号也是从o开始。（注:进程的最后一个页面可能没有一个页框那么大。因此，页框不能太大，否则可能产生过大的内部碎片)
操作系统以页框为单位为各个进程分配内存空间。进程的每个页面分别放入一个页框中。也就是说，进程的页面与内存的页框有一一对应的关系。
各个页面不必连续存放，也不必按先后顺序来，可以放到不相邻的各个页框中。

如何实现地址转换

1．要算出逻辑地址对应的页号
2．要知道该页号对应页面在内存中的起始地址
3．要算出逻辑地址在页面内的“偏移量”
4．物理地址=页面始址＋页内偏移量
如何计算：
- 页号=逻辑地址/页面长度(取除法的整数部分)
- **页内偏移量=**逻辑地址%页面长度
  - （取除法的余数部分)页面在内存中的起始位置:操作系统需要用某种数据结构记进程各个页面的起始位置。

逻辑地址结构

分页存储管理的逻辑地址结构如下所示:

地址结构包含两个部分:前一部分为页号，后一部分为页内偏移量w。在上图所示的例子中，地址长度为32位，其中0~11位为**“页内偏移量”，或称“页内地址**”;12-31位为**“页号”。**
如果有K位表示“页内偏移量”，则说明该系统中一个页面的大小是2^k个内存单元
如果有M位表示“页号”，则说明在该系统中，一个进程最多允许有2^M个页面

页表

1.一个进程对应一张页表
2．进程的每一页对应一个页表项
3．每个页表项由“页号”和“块号”组成
4．页表记录进程页面和实际存放的内存块之间的对应关系
5．每个页表项的长度是相同的**，页号是“隐含”的**

总结

基本地址变换机构

变换机构

基本地址变换机构可以借助进程的页表将逻辑地址转换为物理地址。
通常会在系统中设置一个页表寄存器（PTR），存放页表在内存中的起始地址F和页表长度M。
进程未执行时，页表的始址和页表长度**放在进程控制块（PCB）**中，当进程被调度时，操作系统内核会把它们放到页表寄存器中。
设页面大小为L，逻辑地址A到物理地址E的变换过程如下:

①计算页号Р和页内偏移量w（如果用十进制数手算，则P=A/L，W=A%L;但是在计算机实际运行时，逻辑地址结构是固定不变的，因此计算机硬件可以更快地得到二进制表示的贝亏、贝内偏移量)
②比较页号P和页表长度M，若P≥M，则产生越界中断，否则继续执行。(注意:页号是从O开始的，而页表长度至少是1，因此P=M时也会越界)
③页表中页号p对应的页表项地址=页表起始地址F+页号p*页表项长度，取出该页表项内容b，即为内存块号。
- (注意区分页表项长度、页表长度、页面大小的区别。页表长度指的是这个贝表中总共有几个页表项，即总共有几个页;页表项长度指的是每个页表项占多大的存储空间;页面大小指的是一个页面占多大的存储空间)
④计算E= b*L+w，用得到的物理地址E去访存。(如果内存块号、页面偏移量是用二进制表示的，那么把二者拼接起来就是最终的物理地址了)

例题：

总结

具有快表的地址变换机构

局部性原理

**时间局部性:**如果执行了程序中的某条指令，那么不久后这条指令很有可能再次执行;如果某个数据被访问过，不久之后该数据很可能再次被访问。(因为程序中存在大量的循环)
**空间局部性:**一旦程序访问了某个存储单元，在不久之后，其附近的存储单元也很有可能被访问。(因为很多数据在内存中都是连续存放的)

什么是快表（TLB）

快表，又称联想寄存器(TLB），是一种访问速度比内存快很多的高速缓冲存储器，用来存放当前访问的若干页表项，以加速地址变换的过程。与此对应，内存中的页表常称为慢表。

引入快表后的变换过程

①CPU给出逻辑地址，由某个硬件算得页号、页内偏移量，将页号与快表中的所有页号进行比较。
②如果找到匹配的页号，说明要访问的页表项在快表中有副本，则直接从中取出该页对应的内存块号，再将内存块号与页内偏移量拼接形成物理地址，最后，访问该物理地址对应的内存单元。因此,若快表命中，则访问某个逻辑地址仅需一次访存即可。
③如果没有找到匹配的页号，则需要访问内存中的页表，找到对应页表项，得到页面存放的内存块号，再将内存块号与页内偏移量拼接形成物理地址，最后，访问该物理地址对应的内存单元。因此，若快表未命中，则访问某个逻辑地址需要两次访存（注意:在找到页表项后,应同时将其存入快表,以便后面可能的再次访问。但若快表已满，则必须按照一定的算法对旧的页表项进行替换)

总结

两级页表

单机页表存在的问题

问题一:页表必须连续存放，因此当页表很大时，需要占用很多个连续的页框。
问题二:没有必要让整个页表常驻内存，因为进程在一段时间内可能只需要访问某几个特定的页面。

二级页表的结构

地址变换

虚拟内存

可以在需要访问页面时才把页面调入内存（虚拟存储技术）。可以在页表项中增加一个标志位，用于表示该页面是否已经调入内存

需要注意的细节

若采用多级页表机制，则各级页表的大小不能超过一个页面

例：

两级页表的访存次数
- 第一次访存:访问内存中的页目录表
- 第二次访存:访问内存中的二级页表
- 第三次访存:访问目标内存单元

总结

基本分段存储管理方式

分段

进程的地址空间:按照程序自身的逻辑关系划分为若干个段，每个段都有一个段名(在低级语言中，程序员使用段名来编程)，每段从0开始编址
内存分配规则:以段为单位进行分配，每个段在内存中占据连续空间，但各段之间可以不相邻。

段号的位数决定了每个进程最多可以分几个段
段内地址位数决定了每个段的最大长度是多少

段表

程序分多个段，各段离散地装入内存，为了保证程序能正常运行，就必须能从物理内存中找到各个逻辑段的存放位置。为此，需为每个进程建立一张段映射表，简称**“段表”。**
每个段对应一个段表项，其中记录了该段在内存中的起始位置（又称“基址”）和段的长度。
各个段表项的长度是相同的。例如:某系统按字节寻址，采用分段存储管理，逻辑地址结构为（段号16位,段内地址16位)，因此用16位即可表示最大段长。物理内存大小为4GB（可用32位表示整个物理内存地址空间)。因此，可以让每个段表项占16+32= 48位，即6B。由于段表项长度相同，因此段号可以是隐含的，不占存储空间。若段表存放的起始地址为M，则K号段对应的段表项存放的地址为M+K*6

地址变换

分段分页对比

页是信息的物理单位。分页的主要目的是为了实现离散分配，提高内存利用率。分页仅仅是系统管理上的需要，完全是系统行为，对用户是不可见的。
**段是信息的逻辑单位。**分段的主要目的是更好地满足用户需求。一个段通常包含着一组属于一个逻辑模块的信息。分段对用户是可见的，用户编程时需要显式地给出段名。
页的大小固定且由系统决定。段的长度却不固定，决定于用户编写的程序。
分页的用户进程地址空间是一维的，程序员只需给出一个记忆符即可表示一个地址。
分段的用户进程地址空间是二维的，程序员在标识一个地址时，既要给出段名，也要给出段内地址。
分段比分页更容易实现信息的共享和保护。