(一)计算机系统漫游(上)

1.1 信息就是位+上下文

源程序实际上就是一个由0和1组成的位(又称为比特)序列,这些位被组织成8个一组,称为字节。每个字节都表示程序中某个文本字符。

大部分的现代系统都使用ASCII标准来表示文本字符,这种方式实际上就是用一个惟一的字节大小的整数值来表示每个字符。

只由ASCII字符构成的文件称为文本文件,所有其他文件则称为二进制文件



1.2 程序被其他程序翻译成不同的格式

在hello程序生命周期的一开始时是一个高级C程序,它是能够被人读懂的。

然而,为了在系统上运行hello.c程序,每条C语句都必须被其他程序转化为一系列的低级机器语言指令。

然后这些指令按照一种称为**可执行目标程序(executable object program)**的格式打好包,并以二进制磁盘文件的形式存放起来。

目标程序也称为可执行目标文件(executable objec file)


在Unix系统上,从源文件到目标文件的转化是由编译器驱动程序(compiler driver)完成的:

在这里,gcc编译器驱动程序读取源程序文件hello.c,并把它翻译成一个可执行目标文件hello。


这个翻译的过程是分为四个阶段完成的,如下图所示:

执行这四个阶段的程序(预处理器、编译器、汇编器和链接器)一起构成了编译系统。


  • 预处理阶段。预处理器(cpp)根据以字符#开头的命令(directives),修改原始的C程序。结果就得到了另一个C程序,通常是以.i作为文件扩展名。

  • 编译阶段。编译器(ccl)将文本文件hello.i翻译成文本文件hello.s,它包含一个汇编语言程序。

  • 汇编阶段。汇编器(as)将hello.s翻译成机器语言指令,把这些指令打包成为一种叫做可重定位(relocatable)目标程序的格式,并将结果保存在目标文件hello.o中。

  • 链接阶段。hello程序调用了printf函数。printf函数存在于一个名为printf.o的单独的预编译目标文件中,而这个文件必须以某种方式并入到我们的hello.o程序中。链接器(ld) 就负责处理这种并入,结果就得到hello文件,它是一个可执行目标文件(或者简称为可执行文件)。可执行文件加载到存储器后,由系统负责执行。





参考

《深入理解计算机系统》 —— 1 计算机系统漫游

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值