进程指的是运行起来的可执行程序。它会占用一定的空间和资源。
每个进程拥有一个pid来唯一标识该进程。当一个新的进程被创建时也是先创建pid,再分配进程实体的。
在32位系统下,每个进程的虚拟地址空间位4G(按需分配,实际上没有那么大,只是假想成4G)。而这4G地址被一个叫MMU的部件按照分页的形式映射物理内存。通过不同的页对应不同的数据段,实现不同进程间内存的隔离。
如上图,PP为物理页,VP为虚拟页。
由于每个页大小为4K,所以理论上来说4G虚拟空间中最多有2^20个页。
在内核源码中,表示进程的控制块struct task_struct结构体中,有这一个叫做mm_struct的结构体指针,这个mm_struct用于处理页面映射。
mm_struct中有两个关键的域:pgd和mmap
pgd是一个指针数组,数组中的每一个元素表示一个页目录,而每个页目录又是一个指针数组,数组中的每个元素表示一个页,所以页目录如果2^10个,每个页目录中所代表的页有2^10个,这样的2级映射恰好可以表示2^20个页。在4G以上的系统中,用3级映射,否则用2级映射。
mmap是一个结构体指针,指向一个表示进程数据段信息的结构体,该结构体中有一个vm_start和一个vm_end域表示段的起始和结尾,将这个结构体按照链表的形式连起来,就恰好表示进程实体的各个信息。