《程序员的自我修养》笔记四:可执行文件的装载

背景介绍:

可执行文件(程序)只有装载到内存以后才能被 CPU 执行。

每个程序运行起来后,都拥有自己独立的虚拟地址空间,为程序运行提供内存地址。

程序

静态的概念,一些预先编译好的指令和数据集合的文件

进程

动态的概念,是程序运行时的一个过程


进程虚拟地址空间

每个程序被运行起来后,都拥有自己独立的虚拟地址空间,大小由硬件平台决定(CPU的位数)

  • Linux
    操作系统 1 G,用户进程 3 G

  • Windows
    操作系统 2 G,用户进程 2 G


装载

将可执行文件装载到内存后,供 CPU 执行

装载的方式

  • 覆盖装入(淘汰)

程序员手动将程序分割为若干个模块,按照调用依赖关系组织成树状结构。

  • 页映射

虚拟存储机制的一部分,将内存和磁盘中的数据和指令分『页』,所有的装载和操作单位是页。

32位处理器一页 4096 字节。


可执行文件的装载

装载过程分三步:

  • 进程建立

建立一个独立的虚拟地址空间(分配一个页目录),虚拟空间到物理空间的映射

  • 装载可执行文件

读取可执行文件头,建立虚拟空间与可执行文件的映射关系

  • 执行

将 CPU 的指令寄存器设为可执行文件的入口地址,启动运行

Linux 内核装载 ELF 过程
  1. bash 进程调用 fork 系统调用创建一个新的进程
  2. 新的进程调用 execve 系统调用执行指定的 ELF 文件
  3. 内核开始进行真正的装载工作

装载过程:

  • 调用 load_elf_binary 进行装载处理
  • 检查 ELF 可执行文件格式的有效性
  • 寻找动态链接的 .interp 段,设置动态链接器路径
  • 根据 ELF 可执行文件的程序头表的描述,对 ELF 文件进行映射
  • 初始化 ELF 进程环境,
  • 将系统调用的返回地址修改为 ELF 可执行文件的入口,取决于链接方式,静态链接入口是 ELF 文件的头文件中的 e_entry 所指的地址,动态链接的入口是动态链接器
  • 返回值 do_execve,再返回至 sys_execve。

装载完成

Windows PE 装载

PE 文件中有一个装载的目标地址,即基地址。但是 PE 文件装载时可以被装载到任何地址,基地址不是固定的,每次都会变化。

装载过程:

  • 读取文件第一个页,包含了 DOS 头,PE 文件头和段表
  • 检查进程地址空间中,目标地址是否可用,不可用,选择其他装载地址
  • 使用段表中提供的信息,将 PE 文件中所有的段一一映射到地址空间中相对应的位置
  • 如果装载地址不是目标地址,进行 Rebasing
  • 装载所有 PE 文件所需要的 DLL 文件
  • 对 PE 文件中的所有导入符号进行解析
  • 根据 PE 头中指定的参数,建立初始化堆和栈
  • 建立主线程并启动进程
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值