1.进程地址空间的概念
进程地址空间,顾名思义就是每个进程都会存在一个内存空间
进程=内核数据结构(PCB)+代码和数据
首先我们需要知道地址空间本质上就是数据结构,具体到进程中去就是特定的数据结构对象
例如;
struct 进程地址空间
{
//进程地址空间的属性
struct 进程地址空间 *next
}
这个图大家可能见过,是不是以为我们的进程就是以这样的方式放在内存中呢?
但事实上,这个数据结构(地址空间)并不具备对我们的代码和数据的保存能力,这个数据结构就像是一个酒店的“房卡(虚拟地址)”,我们真正的房主在这个“房卡”所指向的房间(物理地址)。
2.虚拟地址
正如上述所说,我们的这个地址空间(数据结构)只是一个虚拟地址(“房卡”),我们的进程的代码和数据是存放在**物理地址(“酒店房间”)**中的
操作系统这个“酒店老板”只是给了每一位进程“客人”一张“房卡”,他们的真正的东西都存放在**“房卡”指向的房间中,通过服务员(页表),就可以带领见到真正的房间(物理地址)**,这个过程我们称作“页表映射”(学过map的人肯定觉得很熟悉)。
但是这个虚拟地址的概念是有点抽象的
在理解虚拟地址之前,我们要知道
在系统中储存空间只有内存和非内存(磁盘等),像那些栈区堆区静态区数据段什么的都只在内存中,内存就是用来运行的,只有在要运行的程序进程才在上面
一个进程在刚被创建时就已经分配好物理和虚拟内存了
但是这个虚拟内存并不存在内存或外存(但可以一部分在外存中,通过一些算法等)中,它是由操作系统和硬件管理的,是每个进程的一个独立地址空间,虚拟地址空间的布局内容在进程的地址空间中定义
你没看错,就是这么抽象的一种概念,抽象出来的一个内存模型,不直接存在于物理内存或外存中,由这些组件通过映射和管理实现
总的来说虚拟内存里面的所有东西其实表现的话是虚构的,但是整体来说,这个管理的东西是可以通过页表在实际内存中由有实际映射的
3.页表映射
现在我们明白了,我们的进程我们虽然能看到进程的地址空间,但那只是它的虚拟地址
或者说我们在用C/C++语言所看到的地址,全部都是虚拟地址!物理地址,用户一概看不到,由OS统一管理,OS必须负责将 虚拟地址 转化成 物理地址
为了能够将虚拟地址转化为物理地址,系统给我们提供了一张映射表–“页表”
对于进程来说,进程地址是虚拟地址,真正的物理地址需要通过虚拟地址在页表映射得到
具体的映射方式如上图所示,这个数据结构中的每个内容都有都有自己的地址范围,在通过页表在物理内存中映射一块区域
4.为什么要有页表映射呢?
看到这个进程的地址还有如此多奇怪的操作,我们不禁想为什么要通过一个页表来映射空间,就不能直接放到物理内存,直接在物理内存里管理呢?
1.将物理内存从无序变成有序,让进程以统一的视角看待内存
从上述图来看,虚拟地址映射到物理地址的地址可能是这个区域一块,那个区域一块,物理内存里的存储可能是混乱无序的,但如果我们有了页表这个中间转化的结构,哪怕物理内存中的储存再无序,但虚拟地址是有序的,物理内存的有序或无序与进程没有任何关系,因此页表映射使得物理内存从无序变成有序,让进程以统一的视角看待内存
虚拟地址是用来管理进程的(是给进程的,给我们用户的),内存管理是用来管理代码和数据的
2.将进程管理和内存管理进行解耦合(实现内存隔离)
通过增加页表这个中间转化结构,我们可以很好的将进程管理和内存管理分开,左边是进程管理,右边是内存管理,两者之间互不干扰,使进程管理和内存管理进行解耦合
3.地址空间+页表是保护内存安全的重要手段(实现内存隔离)
每个进程都有自己的地址空间,使得进程间的内存相互隔离,提高了系统的稳定性和安全性
地址空间的存在使得进程只能访问自己地址空间内的内存,防止了进程间的非法访问,保护了物理内存的安全
5.关于页表映射的原理
页表映射映射并不是简单的映射,里面还有一些具体的细节
首先,在页表中映射的时候其实是会带有权限的,每次通过页表访问物理地址,都要遵守页表所对应的权限
平时我们在使用malloc/new申请空间时,我们可以直接申请,但在进程地址空间中申请时是不能你写了就能直接申请到空间的的,页表中是带有只读权限的,写了不会直接申请空间给进程,当你真的需要申请空间时,申请时系统会检查你申请的空间是否合法(比如越界了)就会将只读修改,使能狗正常写入,这就是缺页中断
地址空间就像是一张支票,申请好时先没有兑现,当你要用的时候才去兑现