GCC编译的四个阶段

最新推荐文章于 2024-08-17 16:54:14 发布

cptbtptpss

最新推荐文章于 2024-08-17 16:54:14 发布

阅读量1.1w

点赞数 9

文章标签： c linux gcc 汇编语言源代码

本文链接：https://blog.csdn.net/bupt073114/article/details/37049829

版权

gcc编译流程分为4个步骤，分别为：

预处理（Pre-Processing）
编译（compiling）
汇编（Assembling）
链接（Linking）

下面就具体查看gcc是如何完成这四个步骤的。

helloworld.c的源代码

#include <stdio.h>
int main() {
	printf("hello world!\n");
	return 0;
}

（1）预处理阶段

在该阶段，编译器将上述代码中的stdio.h编译进来，并且用户可以使用gcc的选项“-E”进行查看，该选项的作用是把源代码进行预处理。
预处理器根据以字符#开头的命令（directives），修改原始的C程序。如helloworld.c中的#include <stdio.h>指令告诉预处理器读系统头文件stdio.h的内容，并把它直接插入到程序文本中去。结果得到一个C程序，通常是以.i作为文件扩展名的。

注意：gcc指令的一般格式为：gcc [选项] 要编译的文件 [选项] [目标文件]。其中，目标文件可缺省，gcc默认生成的可执行文件名为：编译文件.out

gcc -E helloworld.c -o helloworld.i

选项“-o”是指目标文件，“-i”文件为已经过预处理的C原始程序。以下列出了helloworld.i文件的部分内容：

 wint_t __attribute__((__cdecl__)) __attribute__ ((__nothrow__)) fgetwchar (void);
 wint_t __attribute__((__cdecl__)) __attribute__ ((__nothrow__)) fputwchar (wint_t);
 int __attribute__((__cdecl__)) __attribute__ ((__nothrow__)) getw (FILE*);
 int __attribute__((__cdecl__)) __attribute__ ((__nothrow__)) putw (int, FILE*);
# 2 "helloworld.c" 2
int main() {
 printf("hello world!\n");
 return 0;
}

由此可见，gcc确实进行了预处理，它把“stdio.h”的内容插入到helloworld.c文件中了。

（2）编译阶段
接下来进行的是编译阶段，在这个阶段中，gcc首先要检查代码的规范性、是否有语法错误等，以确定代码实际要做的工作，在检查无误后，gcc把代码编译成汇编代码。用户可以使用“-S”选项来进行查看，该选项生成汇编代码。汇编语言是非常有用的，它为不同高级语言不同编译器提供了通用语言。如：C编译器和Fortran编译器产生的输出文件都是一样的汇编语言。

gcc -S helloworld.i -o helloworld.s

以下列出了helloworld.s的内容，可见gcc已经将其转化为汇编了。感兴趣的读者可以分析一下这一行简单的C语言小程序是如何用汇编代码实现的。

	.file	"helloworld.c"
	.def	___main;	.scl	2;	.type	32;	.endef
	.section .rdata,"dr"
LC0:
	.ascii "hello world!\0"
	.text
	.globl	_main
	.def	_main;	.scl	2;	.type	32;	.endef
_main:
LFB6:
	.cfi_startproc
	pushl	%ebp
	.cfi_def_cfa_offset 8
	.cfi_offset 5, -8
	movl	%esp, %ebp
	.cfi_def_cfa_register 5
	andl	$-16, %esp
	subl	$16, %esp
	call	___main
	movl	$LC0, (%esp)
	call	_puts
	movl	$0, %eax
	leave
	.cfi_restore 5
	.cfi_def_cfa 4, 4
	ret
	.cfi_endproc
LFE6:
	.def	_puts;	.scl	2;	.type	32;	.endef

（3）汇编阶段
汇编阶段是把编译阶段生成的“.s”文件转化成目标文件，读者可以使用选项“-c”把汇编代码转化为“.o”的二进制目标代码了。如下所示：

gcc -c helloworld.s -o helloworld.o

（3）链接阶段

在成功编译之后，就进入了链接阶段。在这里涉及到一个重要的概念：函数库。

读者可以重新查看这个小程序，在这个程序中并没有定义“printf”的函数实现，且在预编译中包含进去的“stdio.h”中也只有该函数的声明，而没有定义函数的实现，那么是在哪里实现的“printf”函数的呢？答案是：系统把这些函数实现都做到了名为libc.so.6的库文件中去了，在没有特别指定时，gcc会到系统默认的搜索路径“/usr/lib”下进行查找，也就是链接到libc.so.6库函数中去，这样就能实现函数“printf”了，而这也就是链接的作用。

函数库一般分为静态库和动态库两种。静态库是指在编译链接时，把库文件的代码全部加入到可执行文件中，因此生成的文件比较大，但在运行时也就不需要库文件了，其后缀一般为“.a”。动态库与之相反，在编译链接时并没有把库文件的代码加入到可执行文件中，而是在程序执行时链接文件加载库，这样就可以节省系统的开销，动态库一般后缀名为“.so”，如前面所述的libc.so.6就是动态库。gcc在编译时默认使用动态库。

完成了链接之后，gcc就可以生成可执行文件了，如下所示：