背景介绍:
可执行文件(程序)只有装载到内存以后才能被 CPU 执行。
每个程序运行起来后,都拥有自己独立的虚拟地址空间,为程序运行提供内存地址。
程序
静态的概念,一些预先编译好的指令和数据集合的文件
进程
动态的概念,是程序运行时的一个过程
进程虚拟地址空间
每个程序被运行起来后,都拥有自己独立的虚拟地址空间,大小由硬件平台决定(CPU的位数)
-
Linux
操作系统 1 G,用户进程 3 G -
Windows
操作系统 2 G,用户进程 2 G
装载
将可执行文件装载到内存后,供 CPU 执行
装载的方式
- 覆盖装入(淘汰)
程序员手动将程序分割为若干个模块,按照调用依赖关系组织成树状结构。
- 页映射
虚拟存储机制的一部分,将内存和磁盘中的数据和指令分『页』,所有的装载和操作单位是页。
32位处理器一页 4096 字节。
可执行文件的装载
装载过程分三步:
- 进程建立
建立一个独立的虚拟地址空间(分配一个页目录),虚拟空间到物理空间的映射
- 装载可执行文件
读取可执行文件头,建立虚拟空间与可执行文件的映射关系
- 执行
将 CPU 的指令寄存器设为可执行文件的入口地址,启动运行
Linux 内核装载 ELF 过程
- bash 进程调用 fork 系统调用创建一个新的进程
- 新的进程调用 execve 系统调用执行指定的 ELF 文件
- 内核开始进行真正的装载工作
装载过程:
- 调用 load_elf_binary 进行装载处理
- 检查 ELF 可执行文件格式的有效性
- 寻找动态链接的 .interp 段,设置动态链接器路径
- 根据 ELF 可执行文件的程序头表的描述,对 ELF 文件进行映射
- 初始化 ELF 进程环境,
- 将系统调用的返回地址修改为 ELF 可执行文件的入口,取决于链接方式,静态链接入口是 ELF 文件的头文件中的 e_entry 所指的地址,动态链接的入口是动态链接器
- 返回值 do_execve,再返回至 sys_execve。
装载完成
Windows PE 装载
PE 文件中有一个装载的目标地址,即基地址。但是 PE 文件装载时可以被装载到任何地址,基地址不是固定的,每次都会变化。
装载过程:
- 读取文件第一个页,包含了 DOS 头,PE 文件头和段表
- 检查进程地址空间中,目标地址是否可用,不可用,选择其他装载地址
- 使用段表中提供的信息,将 PE 文件中所有的段一一映射到地址空间中相对应的位置
- 如果装载地址不是目标地址,进行 Rebasing
- 装载所有 PE 文件所需要的 DLL 文件
- 对 PE 文件中的所有导入符号进行解析
- 根据 PE 头中指定的参数,建立初始化堆和栈
- 建立主线程并启动进程