本章从简单的hello,world
程序讲起,讲解了系统为了执行该程序时,系统发生了什么以及为什么会这样
#include <stdio.h>
int main(){
printf("hello,world\n");
return 0;
}
1.1 信息就是位+上下文
一个程序的生命周期是从一个源程序开始的,即程序员通过编辑器创建并保存的文本文件。
源程序实际上就是由值0和1组成的位(比特)序列。
大部分的现代计算机系统都使用ASCII
标准来表示文本字符
hello.c
的表示方法说明了一个基本思想:系统中的所有信息----包括磁盘文件、内存中的程序,内存中存放的用户数据以及网络上上传的数据,都是由一串比特表示的
1.2 程序被其他程序翻译称为不同格式
为了在系统上运行hello
程序,每条C语句都必须被其他程序转化为一系列的低级机器语言指令
在linux
中,GCC编译器驱动程序读取源文件hello.c
,并把它翻译为一个可执行目标文件hello。
linux> gcc -o hello hello.c
这个翻译过程可分为四个阶段完成, 如图1-3所示。 执行这四个阶段的程序(预处理器、 编译器、 汇编器和链接器一起构成了编译系统
预处理阶段
预处理器(cpp
)根据以字符#开头的命令, 修改原始的C程序,将头文件的内容直接插入程序文本中得到以.i
作为扩展名的文件
编译阶段
译器(eel
)将文本文件hello.i
翻译成文本文件hello.s
, 它包含一 个汇编语言程序。该程序包含函数main的定义,如下
main
subq $8,%rsp
movl $.LC0,$edi
call puts
movl $0,$eax
addq $8,%rsp
ret
汇编阶段
汇编器(as
) 将 hello.s
翻译成机器语言指令,把这些指令打包成一种叫做可重定位目标程序(relocatable object program) 的格式,并将结果保存在目标文件 hello.o
中。 hello.o
文件是一个二进制文件,它包含的 17 个字节是函数 main
的指令编码。
链接阶段
链接器(Id
) 负责将本程序中使用到的C编译器提供的标准C库的函数与本文件链接起来,得到 hello
文件,它是一个可执行目标文件 (或者简称为可执行文件),可以被加载到内存中, 由系统执行。
1.3 了解编译系统如何工作是大有益处的
有一些重要的原因促使程序员必须知道编译系统是如何工作的
- 优化程序性能
- 一个
switch
语句是否总是比一系列的if-else
语旬高效得多? - 一个函数调用的开销有多大?
- while 循环比 for循环更有效吗?
- 指针引用比数组索引更有效吗?
- 为什么我们只是简单地重新排列一下算术表达式中的括号就能让函数运行得更快?
- 一个
- 理解链接时出现的错误
- 链接器报告说它无法解析一个引用, 这是什么意思?
- 静态变量和全局变量的区别是什么?
- 如果在不同的C文件中定义了名字相同的两个全局变量会发生什么?
- 静态库和动态库的区别是什么?
- 在命令行上排列库的顺序有什么影响
- 为什么有些链接 错误直到运行时才会出现?
- 避免安全漏洞
1.4 处理器读并解释储存在内存中的指令
hello.c
源程序已经被编译系统翻译成了可执行目标文件 hello
, 并被存放在磁盘上。 要想在 Unix
系统上运行该可执行文件, 我们将它的文件名输入到称为 shell 的应用程序中:
shell 是一个命令行解释器, 它输出一个提示符, 等待输入一个命令行, 然后执行这个命令。 如果该命令行的第一个单词不是一个内置的 shell 命令, 那么 shell 就会假设这是一个可执行文件的名字, 它将加载并运行这个文件。
1.4.1 系统的硬件组成
上图是一个典系统的硬件组织,接下来进行分别介绍
总线
贯穿整个系统的是一组电子管道, 称作总线, 它携带信息字节并负责在各个部件间传递。
通常总线被设计成传送定长的字节块, 也就是字 (word
)。
I/O设备
I/O(输入/输出)设备是系统与外部世界的联系通道。
本示例中共有四个I/O设备作为用户输入的键盘和鼠标, 作为用户输出的显示器, 以及用千长期存储数据和程序的磁盘驱动器(简单地说就是磁盘)。
每个 I/O 设备都通过一个控制器或适配器与 I/O 总线相连
控制器和适配器之间的区别主要在于它们的封装方式。
- 控制器是1/0设备本身或者系统的主印制电路板(通常称作 主板)上的芯片组。
- 而适配器则是一块插在主板插槽上的卡。
它们的功能都是在 I/O 总线和 I/O 设备之间传递信息。
主存
主存是一个临时存储设备,在处理器执行程序时, 用来存放程序和程序处理的数据。
- 从物理上来说, 主存是由一组动态随机存取存储器(DRAM)芯片组成的。
- 从逻辑上来说, 存储器是一个线性的字节数组, 每个字节都有其唯一的地址(数组索引), 这些地址是从零开始的。
处理器
中央处理单元(CPU
) ,简称处理器, 是解释(或执行)存储在主存中指令的引擎。
从系统通电开始, 直到系统断电, 处理器一直在不断地执行程序计数器指向的指令,再更新程序计数器, 使其指向下一条指令。
程序计数器(PC)
是一个大小为一个字的存储设备(或寄存器)
在任何时刻, PC 都指向主存中的某条机器语言指令(即含有该条指令的地址)
处理器看上去是它的指令集架构的简单实现, 但是实际上现代处理器使用了非常复杂 的机制来加速程序的执行。
1.4.2 运行hello程序
初始时, shell程序执行它的指令, 等待我们输入一个命令。 当我们在键盘上输入字符串 "./hello"
后, shell 程序将字符逐一读入寄存器, 再把它存放到内存中, 如图 1-5 所示
当我们在键盘上敲回车键时, shell程序就知道我们已经结束了命令的输入。 然后 shell执行一系列指令来加载可执行的hello
文件, 这些指令将hello目标文件中的代码和数据从磁盘复制到主存。 数据包括最终会被输出的字符串 “hello, world\n”
。
利用直接存储器存取(DMA
)技术, 数据可以不通过处理器而直 接从磁盘到达主存。 这个步骤如图1-6所示。
一旦目标文件hello
中的代码和数据被加载到主存, 处理器就开始执行hello
程序的main
程序中的机器语言指令。 这些指令将 “hello, world\"
字符串中的字节从主存复制到寄存器文件, 再从寄存器文件中复制到显示设备, 终显示在屏幕上。 这个步骤如图1-7所示。
1.5 高速缓存至关重要
针对处理器与主存之间的速度差异, 系统设计者采用了更小更快的存储设备, 称为高速缓存存储器(cache memory, 简称为cache或高速缓存), 作为暂时的集结区域, 存放处理器近期可能会需要的信息
高速缓存是用一种叫做**静态随机访问存储器(SRAM)**的硬件技术实现的
可以通过建立多级缓存的方式来缓解速度与容量之间的矛盾
系统可以获得一个很大的存储器, 同时访问速度也很快, 原因是利用了高速缓存的局部性原理, 即程序具有访问局部区域里的数据和代码的趋势。通过让高速缓存里存放可能经常访问的数据, 大部分的内存操作都能在快速的高速缓存中完成
图1-8展示了一个典型系统中的高速缓存存储器。
1.6 存储设备形成层次结构
实际上, 每个计算机系统中的存储设备都被组织成了一个存储器层次结构,如图1-9所示。在这个层次结构中,从上至下, 设备的访问速度越来越慢、容最越来越大,并且每字节的造价也越来越便宜。寄存器文件在层次结 构中位于最顶部,也就是第0级或记为L0。这里我们展示的是三层高速缓存L1到L3,占据存储器层次结构的第1层到第3层。主存在第4层,以此类推。
存储器层次结构的主要思想是上一层的存储器作为低一层存储器的高速缓存。
1. 7 操作系统管理硬件
可以把操作系统看成是应用程序和硬件之间插入的一层软件
如图1-10所示。所有应用程序对硬件的操作尝试都必须通过操作系统。
操作系统有两个基本功能:
- 防止硬件被失控的应用程序滥用;
- 向应用程序提供简单一致的机制来控制复杂而又通常大不相同的低级硬件设备。
操作系统通过几个基本的抽象概念(进程、虚拟内存和文件)来实现这两个功能。如图1-11所示, 文件是对I/O设备的抽象表示, 虚拟内存是对主存和磁盘 I/O 设备的抽象表示, 进程则是对处理器、 主存和 I/0 设备的抽象表示