

昨天看了 <<深入理解计算机系统>> 这本神书 “CSAPP” , 初看第一章漫游部分就让人大乎过瘾,其中提到了如何源代码是如何从文本文件编程可执行的二进制文件,整个章节是从软件以及硬件两个层面分别解析的。那么接下来我先从软件层面来解释一下其中步骤。

正常情况下是这样的 gcc -o hello hello.c

在这里,gcc 编译器驱动程序读取源程序文件hello.c,并把它翻译成一个可执行目标文件hello.这个过程可以分为四个阶段完成,如下所示,执行这四个阶段的程序(预处理器,编译器,汇编器和链接器)一起构成了编译系统


由于我们所示例的代码为 C 语言,所以编译器肯定就选用GCC来操作,说到这里我突然想起了这学期所学的编译原理,这确实是一门神课,劝诫学弟学妹们好好学习这门课,借用刘欢学长的话来说就是


首先在 shell 里边输入 gcc --help 得到以下结果

经过反复分析得出结论 其中关于本章节索要学习的相关内容就是如下几个参数啦

  -E                       Preprocess only; do not compile, assemble or link.
  -S                       Compile only; do not assemble or link.
  -c                       Compile and assemble, but do not link.
  -o <file>                Place the output into <file>.

好了我们准备工作已经做好了,借来就直奔今天主题,我以如下 hello.c 文件为例来说明,示例源代码如下

#include <stdio.h>
int main ()

接下来就是男猪脚 hello.c 的变身之旅啦

第一步 预处理阶段 hello.c —> hello.i

执行命令 gcc -E hello.c 会发现会输出在屏幕上, 没有关系加一个重定向符号就ok 啦!

 gcc -E hello.c >  hello.i 
这是我原封不动地把文件中的内容拷贝过来的,可以看到是把stdio.h 替换掉。由此可见编译器还是要处理大量多信息的,不只是那三行代码的。

第二步 编译阶段 hello.i —> hello.s

编译器( ccl ) 将文本文件hello.i翻译成文本文件hello.s 它包含了一个汇编语言程序

执行gcc -S hello.i  得到结果如下

这次就不需要重定向了 其中原因容我想想

	.file	"hello.c"
	.section	.rodata
	.string	"helloworld"
	.globl	main
	.type	main, @function
	pushq	%rbp
	.cfi_def_cfa_offset 16
	.cfi_offset 6, -16
	movq	%rsp, %rbp
	.cfi_def_cfa_register 6
	subq	$32, %rsp
	movl	%edi, -4(%rbp)
	movq	%rsi, -16(%rbp)
	movq	%rdx, -24(%rbp)
	leaq	.LC0(%rip), %rdi
	movl	$0, %eax
	call	printf@PLT
	movl	$0, %eax
	.cfi_def_cfa 7, 8
	.size	main, .-main
	.ident	"GCC: (Debian 7.3.0-19) 7.3.0"
	.section	.note.GNU-stack,"",@progbits

第三步 汇编阶段 hello.s —> hello.o

接下来 汇编器(as) 将hello.s 翻译成机器语言指令,将这些命令打包成一个叫做可重定位目标程序的格式。hello.o 是一个二进制文件

执行 gcc -c hello.i  得到结果如下
UH??H?? ?}?H?u?H?U?H?=?????helloworldGCC: (Debian 7.3.0-19) 7.3.0zRx?+A?C
f??	+$hello.cmain_GLOBAL_OFFSET_TABLE_printf???????? ???????? .symtab.strtab.shstrtab.rela.text.data.bss.rodata.comment.note.GNU-stack.rela.eh_frame @+@ 0
? 		?+ha

这些都是大段的二进制代码,我的大脑已经无发解析,但是突发奇想,我od 输出一下,然后再根据 Ascal 码表进行翻译看看到底是什么东东。

第四步 链接阶段 hello.o —> hello

本程序调用了printf 函数这是一个C标准库函数,printf 函数存在于一个名为printf.o的单独的预编译好了的目标文件中,而这个文件必须以某种方式合并到我们的hello.o程序中,链接器( ld ) 就负责这种合并,结果就得到hello 文件,他是一个可执行目标文件,可以被加载到内存中去,由系统执行.

这一步需要执行一下  gcc -o hello  hello.o 

这样子我们就可以得到一个可执行文件了 所以我们把它./hello 输出,得到如下

⚙ liujiahui@liujiahui-PC  ~  ./hello 

至此我们就完成了hello.c 之旅。

