进程虚拟空间示意图
Linux使用两种保护机制:0级(最高级别)提供内核使用,3级(最低级别)提供用户程序使用。从上图中可以看出,每个进程拥有各自的私有用户空间(0-3G),这个空间对系统中其他进程是不可见的,最高的1G虚拟内核空间则为所有进程以及内核所共享。
进程运行时,需要访问物理内存,因此就存在一种从虚拟地址空间到物理内存空间的映射。Linux采用分页的方法,将虚拟地址空间分成许多的页,每页的大小由CPU决定,然后由操作系统选择页的大小。目前Inter系列的CPU支持4KB或4MB的页大小,而PC上都选择使用4KB。按这种选择,4GB虚拟地址空间总共可以分成1048576个页,512M的物理内存可以分为131072个页框(通常将物理空间内的分页称为页框)。虚拟空间的页和物理内存中页框的映射关系存储在页表中。当CPU要访问程序中用到的某个虚拟地址时,会通过查询页表,找到对应的物理内存空间。
3.9创建进程
Linux进程创建很特别。许多其他的操作系统都提供了产生(spawn)进程的机制,首先在新的地址空间里创建进程,读入可执行文件,最后开始执行。Linux采用了与众不同的实现方式,它把上述步骤分解到两个单独的函数中去执行:fork()和exec()。首先,fork通过拷贝当前进程创建一个子进程。子进程与父进程的区别仅仅在于PID、PPID(父进程的进程号,子进程将其设置为被拷贝进程的PID)和某些资源和统计量(例如挂起的信号,它没有必要被继承)。exec()函数负责读取可执行文件并将其载入地址空间开始执行。把这两个函数组合起来使用的效果跟其他系统使用的单一函数的效果相似。
3.9.1 写时拷贝
传统的fork()系统调用直接把所有的资源复制给新创建的进程。这种实现过于简单并且效率低下,因为它拷贝的数据也许并不共享,更糟的情况是,如果新进程打算立即执行一个新的映像,那么所有的拷贝都将前功尽弃。
Linux的fork()使用写时拷贝(copy-on-write)页实现。写时拷贝是一种可以推迟甚至免除拷贝数据的技术。内核此时并不复制整个进程地址空间,而是让父进程和子进程共享同一个拷贝。只有在需要写入的时候,数据才会被复制,从而使各自进程拥有各自的拷贝。也就是说,资源的复制只有在需要写入的时候才进行,在此之前,只是以只读的方式共享。这种技