系统初始化

06 x86架构
x86架构统一了计算机的硬件环境,避免了linux操作系统适配不同的硬件平台。

硬件图和计算机的逻辑图
如图:

 

cpu:中央处理器,是最核心的组件。
总线:连接了cpu和其他设备(如内存、显卡、网卡、磁盘、USB),其实就是主板上的集成电路,可以划分为:
地址总线:根据地址从内存中获取那个位置的数据
数据总线:传输真正的数据

数据总线的位数:决定了一次能拿多少个数据进来。例如只有两位,那 CPU 一次只能从内存拿两位数。要想拿八位,就要拿四次。位数越多,一次拿的数据就越多,访问速度也就越快。
地址总线的位数:决定了能访问的地址范围到底有多广。例如只有两位,那 CPU 就只能认 00,01,10,11 四个位置,如果是20位,那就可以访问2^20=1M

cpu=运算单元+数据单元+控制单元
运算单元:仅负责运算,如加法、位移等,不知道计算哪些数据、结果存储到哪里
数据单元:cpu内部的缓存器和寄存器组,空间很小,但是相对内存无需通过数据总线,所以速度极快,用于暂时存放数据和运算结果
控制单元:指挥中心,可以获取下一条指令,用于指导运算单元取出数据单元中的几个数据,然后将计算的结果存储到数据单元。

两个进程 A 和 B,会有独立的内存空间,互相隔离,程序会分别加载到进程 A 和进程 B 的内存空间里面,形成各自的代码段。

控制单元又包括:
指令起始地址寄存器
数据起始地址寄存器
指令指针寄存器,它里面存放的是下一条指令在内存中的地址。
指令寄存器:控制单元会不停地将代码段的指令拿进来,先放入指令寄存器

指令包括:对什么数据做什么操作
执行指令:会把操作交给运算单元,数据交给数据单元;数据单元根据数据地址从数据段读取数据到数据寄存器中,运算单元计算后得到结果,结果会暂存到数据单元的数据寄存器中,最终会有指令将数据写回到内存中的数据段。

英特尔的技术成为了行业的开放事实标准。由于这个系列开端于 8086,因此称为 x86 架构。

8086的原理
cpu组件图:


cpu内部的数据单元:8个16位的通用寄存器,:分别是 AX、BX、CX、DX、SP、BP、SI、DI;其中 AX、BX、CX、DX 可以分成两个 8 位的寄存器来使用,分别是 AH、AL、BH、BL、CH、CL、DH、DL,其中 H 就是 High(高位),L 就是 Low(低位)的意思。

 

控制单元:
IP寄存器就是指令指针寄存器(Instruction Pointer Register),指向代码段中下一条指令的位置
切换进程呢?每个进程都分代码段和数据段,为了指向不同进程的地址空间,有四个 16 位的段寄存器,分别是 CS(代码段寄存器,code segment register)、DS(数据)、SS(栈)、ES。

段寄存器:CS和DS都是 16 位的,8086 的地址总线地址是20位,解决方案如下:
CS 和 DS 中的值左移 4 位,变成 20 位的,加上 16 位的偏移量,得到最终 20 位的数据地址。
此时能够区分的地址:2^20=1M
一个段最大:2^16=64k
所以:对于 8086CPU,最多只能访问 1M 的内存空间,还要分成多个段,每个段最多 64K。


32位处理器
此时有32跟地址总线,可以访问2^32=4G 的内存。
那如何跟原来的架构兼容呢?
通用寄存器,将 8 个 16 位的扩展到 8 个 32 位的,但是依然可以保留 16 位的和 8 位的使用方式。
指令指针寄存器 IP,就会扩展成 32 位的,同样也兼容 16 位的。

段寄存器:
实模式:16位,CS 和 DS 中的值左移 4 位,变成 20 位的,加上 16 位的偏移量,得到最终 20 位的数据地址。系统刚启动一般处于该模式。

保护模式:
CS、SS、DS、ES仍然是16位的,但是不再是段的起始地址,保存的是在这个表格中的哪一项,称为选择子(Selector)。
段描述符:段的起始地址,在内存中。
所以:原本从段寄存器直接拿到的段起始地址,就变成了先间接地从段寄存器找到表格中的一项,再从表格中的一项中拿到段起始地址


调整后结构如图所示:

7 从BIOS到bootloader
- 实模式只有 1MB 内存寻址空间,每个段最多64K(X86)
- 加电, 重置 CS 为 0xFFFF , IP 为 0x0000, 对应 BIOS 程序
- 0xF0000-0xFFFFF 映射到 BIOS 程序(存储在ROM中,固化的初始化程序), BIOS 做以下三件事:
    - 检查硬件
    - 提供基本输入(中断)输出(显存映射)服务
    - 加载 MBR 到内存(0x7c00)
- MBR: 启动盘第一个扇区(512B, 由 Grub2 写入 boot.img 镜像)
- boot.img 加载 Grub2 的 core.img 镜像
- core.img 包括 diskroot.img, lzma_decompress.img, kernel.img 以及其他模块
- boot.img 先加载运行 diskroot.img, 再由 diskroot.img 加载 core.img 的其他内容
- diskroot.img 解压运行 lzma_compress.img, 由lzma_compress.img 切换到保护模式

-----------

- 切换到保护模式需要做以下三件事:
    - 启用分段, 就是在内存里面建立段描述符表,将寄存器里面的段寄存器变成段选择子,指向段描述符,辅助进程管理
    - 启动分页, 辅助内存管理
    - 打开其他地址线
- lzma_compress.img 解压运行 grub 内核 kernel.img, kernel.img 做以下四件事:
    - 解析 grub.conf 文件
    - 选择操作系统
    - 例如选择 linux16, 会先读取内核头部数据进行检查, 检查通过后加载完整系统内核
    - 启动系统内核

ROM:read only memory,只读存储器
BIOS:basic input and output system


8 内核初始化
- 内核初始化, 运行 `start_kernel()` 函数(位于 init/main.c), 初始化做三件事
    - 创建样板进程(0号进程), 及各个模块(中断、内存管理、进程调度、文件系统)初始化
    - 创建用于管理和创建用户态进程的进程
    - 创建用于管理和创建内核态进程的进程
---
- 创建样板进程(0号进程),及各个模块初始化
    - 创建第一个进程, 0号进程. `set_task_stack_end_magic(&init_task)` and `struct task_struct init_task = INIT_TASK(init_task)`
    - 初始化中断, `trap_init()`. 系统调用也是通过发送中断进行, 由 `set_system_intr_gate()` 完成.
    - 初始化内存管理模块, `mm_init()`
    - 初始化进程调度模块, `sched_init()`
    - 初始化基于内存的文件系统 rootfs, `vfs_caches_init()`
        - VFS(虚拟文件系统)将各种文件系统抽象成统一接口
    - 调用 `rest_init()` 完成其他初始化工作
---
- 创建管理和创建用户态进程的进程, 1号进程
    - `rest_init()` 通过 `kernel_thread(kernel_init,...)` 创建 1号进程(工作在用户态).
    - 权限管理
        - x86 提供 4个 Ring 分层权限
        - 操作系统利用: Ring0-内核态(访问核心资源); Ring3-用户态(普通程序)
    - 用户态调用系统调用: 用户态-系统调用-保存寄存器-内核态执行系统调用-恢复寄存器-返回用户态
    - 新进程执行 kernel_init 函数, 先运行 ramdisk 的 /init 程序(位于内存中)
        - 首先加载 ELF 文件
        - 设置用于保存用户态寄存器的结构体
        - 返回进入用户态
        - /init 加载存储设备的驱动
     - kernel_init 函数启动存储设备文件系统上的 init
---
- 创建管理/创建内核态进程的进程, 2号进程
    - `rest_init()` 通过 `kernel_thread(kthreadd,...)` 创建 2号进程(工作在内核态).
    - `kthreadd` 负责所有内核态线程的调度和管理


9 系统调用
- glibc 将系统调用封装成更友好的接口
- 本节解析 glibc 函数如何调用到内核的 open
---
- 用户进程调用 open 函数
    - glibc 的 syscal.list 列出 glibc 函数对应的系统调用
    - glibc 的脚本 make_syscall.sh 根据 syscal.list 生成对应的宏定义(函数映射到系统调用)
    - glibc 的 syscal-template.S 使用这些宏, 定义了系统调用的调用方式(也是通过宏)
    - 其中会调用 DO_CALL (也是一个宏), 32位与 64位实现不同
---
- 32位 DO_CALL (位于 i386 目录下 sysdep.h)
    - 将调用参数放入寄存器中, 由系统调用名得到系统调用号, 放入 eax
    - 执行 ENTER_KERNEL(一个宏), 对应 int $0x80 触发软中断, 进入内核
    - 调用软中断处理函数 entry_INT80_32(内核启动时, 由 trap_init() 配置)
    - entry_INT80_32 将用户态寄存器存入 pt_regs 中(保存现场以及系统调用参数), 调用 do_syscall_32_iraq_on
    - do_syscall_32_iraq_on 从 pt_regs 中取系统调用号(eax), 从系统调用表得到对应实现函数, 取 pt_regs 中存储的参数, 调用系统调用
    - entry_INT80_32 调用 INTERRUPT_RUTURN(一个宏)对应 iret 指令, 系统调用结果存在 pt_regs 的 eax 位置, 根据 pt_regs 恢复用户态进程

---
- 64位 DO_CALL (位于 x86_64 目录下 sysdep.h)
    - 通过系统调用名得到系统调用号, 存入 rax; 不同中断, 执行 syscall 指令
    - MSR(特殊模块寄存器), 辅助完成某些功能(包括系统调用)
    - trap_init() 会调用 cpu_init->syscall_init 设置该寄存器
    - syscall 从 MSR 寄存器中, 拿出函数地址进行调用, 即调用 entry_SYSCALL_64
    - entry_SYSCALL_64 先保存用户态寄存器到 pt_regs 中
    - 调用 entry_SYSCALL64_slow_pat->do_syscall_64
    - do_syscall_64 从 rax 取系统调用号, 从系统调用表得到对应实现函数, 取 pt_regs 中存储的参数, 调用系统调用
    - 返回执行 USERGS_SYSRET64(一个宏), 对应执行 swapgs 和 sysretq 指令; 系统调用结果存在 pt_regs 的 ax 位置, 根据 pt_regs 恢复用户态进程
---
- 系统调用表 sys_call_table
    - 32位 定义在 arch/x86/entry/syscalls/syscall_32.tbl
    - 64位 定义在 arch/x86/entry/syscalls/syscall_64.tbl
    - syscall_*.tbl 内容包括: 系统调用号, 系统调用名, 内核实现函数名(以 sys 开头)
    - 内核实现函数的声明: include/linux/syscall.h
    - 内核实现函数的实现: 某个 .c 文件, 例如 sys_open 的实现在 fs/open.c
        - .c 文件中, 以宏的方式替代函数名, 用多层宏构建函数头
    - 编译过程中, 通过 syscall_*.tbl 生成 unistd_*.h 文件
        - unistd_*.h 包含系统调用与实现函数的对应关系
    - syscall_*.h include 了 unistd_*.h 头文件, 并定义了系统调用表(数组)
 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值