Hello world 程序的编译过程 (C语言描述)

最新推荐文章于 2024-03-19 22:45:00 发布

DY老王

最新推荐文章于 2024-03-19 22:45:00 发布

阅读量1.4k

点赞数 1

分类专栏： C语言文章标签： c语言

本文链接：https://blog.csdn.net/qq_44865780/article/details/105340283

版权

C语言专栏收录该内容

1 篇文章 0 订阅

订阅专栏

示例代码 hello.c

#include <stdio.h>

int main() {
	printf("hello, world\n");
	return 0;
}

程序被其他程序翻译成不同格式

hello程序的生命周期是从一个高级C语言程序开始的，因为这种形式能够被人读懂。然而，为了在系统上运行hello.c程序，每条C语句都必须被其他程序转化为一系列的低级 机器语言指令。然后这些指令按照一种称为 可执行目标程序 的格式打好包，并以二进制磁盘文件的形式存放起来。目标程序也称为 可执行目标文件。

在linux系统上，从源文件到目标文件的转化是由编译器驱动程序完成的：

linux> gcc -o hello hello.c

在这里，GCC编译器驱动程序读取源程序文件hello.c，并把它翻译成一个可执行目标文件hello。这个翻译过程可分为四个阶段完成，如下图所示。执行者四个阶段的程序（预处理器、编译器、汇编器和链接器）一起构成了 编译系统。

● 预处理阶段。预处理器（cpp）根据以字符#开头的命令，修改原始的C程序。比如 hello.c 中第 1 行的 #include <stdio.h> 命令告诉预处理器读取系统头文件 stdio.h 的内容，并把它直接插入程序文本中。结果就得到了另一个 C 程序，通常是以 .i 作为文件扩展名。

● 编译阶段。编译器（ccl）将文本文件 hello.c 翻译成文本文件 hello.s，它包含一个汇编语言程序。该程序包含函数 main 的定义，如下所示。

main
	subq	$8, %rsp
	movl	$.LCO, %edi
	call	puts
	movl	%0, %eax
	addq	$9, %rsp
	ret

定义中 2 ~ 7 行的每条语句都以一种文本格式描述了一条低级机器语言指令。汇编语言是非常有用的，因为它为不同高级语言的不同编译器提供了通用的输出语言。例如，C编译器和 Fortran 编译器产生的输出文件用的都是一样的汇编语言。

● 汇编阶段。接下来，汇编器（as）将 hello.s 翻译成机器语言指令，把这些指令打包成一种叫做 可重定位目标程序 的格式，并将结果保存在目标文件 hello.o 中。hello.o 文件时一个二进制文件，他包含的 17 个字节是函数 main 的指令编码。如果我们在文本编辑器中打开 hello.o 文件，将看到一堆乱码。

● 链接阶段。请注意，hello 程序调用了 printf 函数，它是每个 C 编译器都提供的标准 C 库中的一个函数。printf 函数存在于一个名为 printf.o 的单独的预编译好了的目标文件中，而这个文件必须以某种方式合并到我们的 hello.o 程序中。链接器（ld）就负责处理这种合并。结果就得到 hello 文件，它是一个可执行目标文件（或者简称为可执行文件），可以被加载到内存中，有系统执行。