目录
1 编译的四个阶段
- 预处理:hello.c经过预处理得到hello.i,该文件仍旧是文本文件。预处理其会读取头文件#include <stdio.h>,将该头文件的内容直接插入到源程序中,形成另一个C程序。
- 编译:hello.i被编译为hello.s。包括词法分析、语法分析、语义分析、中间代码生成和优化。
- 汇编:hello.s被翻译成为机器指令,并把机器指令按照固定规则进行打包,得到可重定位目标文件hello.o(二进制但不可以执行)。
- 链接:链接器把提前编译好的目标文件和hello.o进行合并。此时链接器要对两个文件进行调整,最后可以得到可执行目标文件hello。
2 为何要理解编译系统是如何工作的?
- 优化程序性能。如 switch 和 if 哪个更加高效?——ch3 ch4
- 理解链接时出现的错误。——ch7
- 避免安全漏洞。——ch3
3 如何运行编译后得到的可执行程序?
3.1 什么是linux shell?
shell 是一个命令解释程序。执行命令,如果第一个字符不是默认的shell命令,则假设它是可执行文件的名字。
4 硬件组成
4.1 CPU 中央处理单元
- PC(program count) 程序计数器:其实是大小为一个字的存储区域,对于64位的机器,一个字就是8=64/8个字节。当处理器通电,它就开始不断地执行PC指向的指令,然后更新PC使其指向下一条要执行的指令。
- 寄存器文件:一个临时存放各种变量的空间。
- ALU
4.2 主存(内存)——ch6
由随机动态存储器芯片组成,主要存放程序指令和数据,逻辑上是一个从0开始的大数组
4.3 总线I/O——ch6、10
负责将信息从一个部件传送到另一个部件,通常传送数据块的大小是字
4.4 输入输出设备
每个~都由一个控制器与适配器(在I/O设备和I/O总线间传递数据)和I/O总线相连。
4.5 hello world的执行过程
- 键盘输入“./hello”的字符串。
- shell将输入的字符读入寄存器,寄存器会把hello这个字符串放入内存中。
- 按下会车,shell程序就明白我们已经完成了输入,然后执行一些列文件执行可执行文件hello。
- 将hello字段中的文件和代码加载到内存。利用DMA技术,数据直接从磁盘到达内存。
- 然后处理器执行main函数中的代码,存储器将hello字段从内存调入寄存器,再从寄存器调入到显示屏幕
5 存储器
容量越大,访问速度越慢。
6 操作系统(硬件真正的操控者)
6.1 为什么需要中间层?
- 防止硬件被失控的应用程序滥用。
- 提供统一的机制来控制这些复杂的底层硬件
6.2 进程与线程
6.2.1 上下文
进程运行过程中所需要的状态信息,如 内存中的值
通过系统调用,将控制权从shell进程传递给操作系统。
操作系统保存shell进程的上下文,然后创建新的hello进程,然后将控制权转交给hello进程。
hello进程执行完后,操作系统会恢复shell进程的上下文,并将控制权交给shell进程,shell进程等待下一个命令的输入。
6.3 虚拟地址空间
从下到上:
读写数据的区域:从可执行目标文件中加载而来
堆:c语言的malloc函数,可以动态扩展和收缩。
共享库:C语言标准库。
用户栈:函数调用的本质是压栈。
最顶部:内核,对应用程序不可见。
7 一切皆为文件
系统中所有的输入和输出都可以通过读写文件来完成。
8 阿姆达尔定律
考虑到极限情况,k——>∞,,对大部分软硬件做优化才能得到双倍的性能提升。
8.1 如何获得更高的计算能力
线程级并发
指令级并行:每个周期2~4条的指令执行效率,流水线技术
单指令、多数据并行