总结一下Linux内核启动一个ELF可执行文件的大概过程,其中大部分的细节都并没有深究过,但总的流程还算比较清楚。如果涉及到与体系结构有关的内容,只讲ARM的。
就从do_execve()函数开始讲起,因为无论是系统调用(即一个进程启动另一个进程)还是启动kernel线程(即系统自己决定启动一个进程,比如系统引导后由kernel启动的第一个进程init)都会调到这个函数。
do_execve()只是一个封装,接着就直接调用do_execve_common(),这是真正主要的部分。下面只捡主要的步骤说,细节不论。
先是构造一个结构体struct linux_binprm的实例,这个结构里将包含有可执行文件的各种参数。
接下来,调用bprm_mm_init()初始化进程的虚拟内存,其中比较重要的,一个是构造了进程的mm_struct结构,再就是为进程申请了页表。当然这个时候还没有什么内容被映射到进程空间,所以只需要申请PGD就可以了。
[c]
retval = bprm_mm_init(bprm);
if (retval)
goto out_file;
[/c]
不过也有例外,在函数pgd_t *pgd_alloc(struct mm_struct *mm)中(arch/arm/mm/pgd.c),还会区分“中断向量表”是在低内存还是在高内存。在比较早的ARM系统中,中断向量表只能被存放在靠近内存0地址附近(一页就够了),所以所有的进程都必须注意这一点,并且把这一页给让出来;但是在ARMv4之后,中断向量表的位置就可以配置,可以把中断向量表的位置设置到高内存处(靠近4G边界的地方),这样的话,中断向量表就位于内核空间,在0~3G的进程空间中就不用再特别考虑它了。
下面的这段代码就是做了一个判断,如果中断向量表在低地址处,就在这里先把从0地址开始的这一页给映射起来,并把它给占上。
[c]
pgd_t *pgd_alloc(struct mm_struct *mm)
{
......