本部分讨论不具备对换功能的纯分页模式,作业运行需要全部装入内存。
比较连续分配方式:
- 作业逻辑地址空间有M大,就需要向内存申请一个M大的连续区域。
- 分页的目的是更细粒度的处理空间,减少粗放管理的浪费或开销问题。
一、概念
1.页面
内存划分成多个小单元,每个单元K大小,称(物理)块。
作业也按K单位大小划分成片,称为页面。
物理划分块的大小 = 逻辑划分的页的大小
页面大小要适中。
- 太大,(最后一页)内碎片增大,类似连续分配的问题。1
- 太小的话,页面碎片总空间虽然小,提高了利用率,但每个进程的页面数量较多,页表过长,反而又增加了空间使用。
2.页表
为了找到被离散分配到内存中的作业,记录每个作业各页映射到哪个物理块,形成的页面映射表,简称页表。
每个作业有自己的页表
- 页表的作用:
页号到物理块号的地址映射 - 要找到作业A
关键是找到页表(PCB)
根据页表找物理块
若内存和作业均按1K大小划分块或页,一个4K大的作业可如下图般分配:
(1)离散分配过程:
- 找空:空闲空间管理
- 放入:装入与地址映射(形成页表)
- 记录:页表地址记入pcb
(2)如何运行一个作业?
- 连续方式下
PCB记录内存首地址,根据该地址顺序取指令执行即可。 - 离散方式下
页表记录作业的各页分别占用了内存的哪些块;
pcb则记录页表在内存的地址——进程构造时伴随着构造页表,该核心信息也要放在内存中供访问。
③地址的处理
连续方式下,每条指令用基地址+偏移量即可找到其物理存放的地址。
下面介绍分页方式下详细的地址处理
3.地址映射(地址计算)的过程
(1)依据相对地址计算
若要执行某作业的一条指令,其相对地址是24B (设10B一页,页表如右表),计算其物理地址:
- ①分析其所在的页和偏移得:2号页(页号从0开始) ,偏移4B处是该条指令
- ②查页表找页面对应的块(2号页保存在6号物理块)
- ③找物理块6,向下偏移4B,找到要执行的指令。取出执行即可。
- ④计算上就是求商(页号)及取余(偏移量)的过程
(2)二进制地址具体是如何计算从而映射到物理地址?
设一分页系统,页面大小为8B(设8条指令)
一个大小为 32B (四位二进制)的作业分配内存
页面大小为8B即物理块的页内偏移量占3位
规律
- 作业相对地址在分页下不同位置的数有一定的意义结构:
页号+页内地址(即页内偏移) - 关键的计算是:根据系统页面大小找到不同意义二进制位的分界线。
- 从地址中分析出页号后,地址映射只需要把页号改为对应物理块号,偏移不变,即可找到内存中实际位置。
注意:一作业所有指令在用户地址空间是顺序编址
- 例:某系统采用页式存储管理方式,物理内存空间1M,页面大小2K,若逻辑空间32页,计算:
(1)逻辑地址格式
(2)不考虑权限等问题,进程的页表有多少项(即页表记录条数)?每项多少位?
(2)物理空间减一半,页表有什么变化?
答:(1)页面大小2K,则页内偏移量有11位;共32页,需5位。
(2)有32页,则页表有32项;
每项映射一个物理地址,要计算共多少个物理块:1M/2K=0.5K(29)
则每项有9位。
(3)项数还是32,但物理块数变了,块号编号位数减1。
总结
- 页面大小决定偏移量(页内地址)的位数 n;
- 作业大小->页面数量
->页表长度 a
->页号的位数 m(或总位数-页内位数) - 内存容量决定块数,块数决定编址位数,即页表项位数 b。
页表数据放在哪?
寄存器。一个进程有n个页,页表就需要记录n项数据,需要n个寄存器。不现实。
内存。只设置一个页表寄存器PTR(page table register)记录页表在内存中的首地址和页表长度,运行时快速定位页表。
4.地址变换机构
由地址变换机构实现地址映射
页表数据放在哪?
- 寄存器。一个进程有n个页,页表就需要记录n项数据,需要n个寄存器。不现实。
- 内存。只设置一个页表寄存器PTR(page table register)记录页表在内存中的首地址和页表长度,运行时快速定位页表。
(1)地址变换过程
分页系统中,进程创建,放入内存,构建页表,在PCB中记录页表存放在内存的首地址及页表长度。
- ①运行某进程A时,将A进程PCB中的页表信息写入PTR中;
- ②每执行一条指令时,根据分页计算原理,得到指令页号X和内部偏移量Y;
- ③CPU高速访问PTR找到页表在哪里;
为防止错误检索,增加预先的判断:
计算得到的页号是否大于页表长度(即页表项数)
一个5页的进程,页面编号0-4,若地址计算出的页号不在该范围,一定产生了越界错误。 - ④查页表数据,得到X实际对应存放的物理块,完成地址映射计算,最终在内存找到该指令。
访问内存的有效时间
进程发出逻辑地址的访问请求,经过地址变换,到内存中找到对应的实际物理地址单元并取出数据,所需花费的总时间,称为内存的有效访问时间EAT(effective access time)
设访问一次内存时间为t,则基本分页机制下EAT=2t
因为CPU操作一条指令需访问内存两次:
- 访问内存中的页表(以计算指令所在的实际物理地址)
- 访问指令内存地址
5.引入快表——针对访问速度问题
- 问题:基本分页机制下,一次指令需两次内存访问,处理机速度降低1/2,分页空间效率的提高以如此的速度为代价,得不偿失。
- 改进:减少第1步访问内存的时间。增设一个具有“并行查询”能力的高速缓冲寄存器,称为“快表”,也称“联想寄存器”(Associative memory),IBM系统称为TLB(Translation Look aside Buffer)。
- 快表放什么?:
正在执行进程的页表的数据项。 - 引入快表后的内存访问时间:
快表的寄存器单元数量是有限的,不能装下一个进程的所有页表项。虽不能完全避免两次访问内存,但如果命中率a高还是能大幅度提高速度。
设一次查找访问快表时间为t’ ,则
EAT= at’ + (1-a)(t’+t) + t
= 2t +t’ -ta
6.两级、多级页表,反置页表——针对大页表占用内存问题
进程分页离散存放,但页表的数据是连续在存放内存的。而页表可能很大
(1)两级页表
- 将页表分页,并离散地将页表的各个页面分别存放在不同的物理块中
- 为离散分配的页表再建立一张页表,称为“外层页表”,其每个表项记录了页表页面所在的物理块号。
(2)多级页表
64位操作系统下,两级仍然不足以解决页表过大问题时,可按同样道理继续分页下去形成多级页表。
(3)反置页表
- 站在物理块的角度,记录占用它的已调入内存的进程标识和页号。系统中只需一张该表即可。一个64MB内存,若页面大小4KB(64M/4K=2^16=16K个物理块),反置页表占用64KB(16K*4B)
- 进程外部页表(External Page Table):每个进程一张,记录进程不在内存中的那些页面所在的外存物理位置。
- 如何提高检索反置页表速度:内存容量大时,反置页表的页表项还是会很大,利用进程标识符和页号去检索一张大的线性表很费时,可利用hash算法提高检索速度。