GCC编译过程解析

在编程过程中,我们经常会使用到GCC(或交叉编译链)来编译源代码,只有真正了解了GCC编译的具体过程,才能理解编译的精髓。

通常我们将gcc的编译流程分为以下四个步骤:
1、预处理(Pre-Processing)
2、编译(Compiling)
3、汇编(Assembling)
4、链接(Linking)

helloworld.c为例子,通过以上四个步骤中可分别生成helloworld.i,helloworld.s,helloworld.o以及最终的helloworld文件。

通过具体源代码以及各阶段编译的生成文见具体分析编译过程:
helloworld.c: 最初的源代码文件;
helloworld.i: 经过编译预处理的源代码;
helloworld.s: 汇编处理后的汇编代码;
helloworld.o: 编译后的目标文件,即含有最终编译出的机器码,但它里面所引用的其他文件中函数的内存位置尚未定义。
helloworld: 最终的可执行文件

helloworld.c源代码

#include<stdio.h>
int main(void)
{
printf("Hello World!\n");

return 0;
}

gcc编译指令格式:

gcc [选项] 源文件 [选项] [目标文件]
其中,目标文件可缺省,gcc默认生成可执行的文件名为:a.out

(1)预处理阶段

在该阶段,编译器将上述代码中的stdio.h编译进来,并且用户可以使用gcc的选项”-E”进行查看,该选项的作用是让gcc在预处理结束后停止编译过程

处理过程:预处理器根据以字符#开头的命令,修改原始的C程序,从而得到另外一个C程序,通常是以.i作为文件扩展名的。如helloworld.c中#include <stdio.h>指令告诉预处理器读系统头文件stdio.h的内容,并把它直接插入到程序文本中去。

命令:gcc –E helloworld.c –o helloworld.i

选项”-o”是指目标文件”.i”文件为已经过预处理的C原始程序。下面helloworld.i文件的部分内容:

typedef int (*__gconv_trans_fct) (struct __gconv_step *,
struct __gconv_step_data *, void *,
__const unsigned char *,
__const unsigned char **,
__const unsigned char *, unsigned char **,
size_t *);

# 2 "helloworld.c" 2

int main(void)
{
printf("Hello World!\n");

return 0;
}

分析gcc确实进行预处理,把”stdio.h”的内容插入到helloworld.i文件中。

(2)编译阶段

此阶段中,就是gcc把预处理后的代码翻译成汇编语言的过程。当然,在此之前gcc首先要检查代码的规范性、是否有语法错误等,检查无误后才开始编译。用户可以使用”-S”选项来进行查看,该选项只进行编译而不进行汇编,生成汇编代码。汇编语言是非常有用的,它为不同高级语言不同编译器提供了通用的语言。

命令:gcc –S helloworld.i –o helloworld.s
以下列出了helloworld.s的内容,读者可自行分析一下此段小程序是如何用汇编代码实现的。
.file "helloworld.c"
.section .rodata
.align 4

.LC0:
.string "Hello World!"
.text
.globl main
.type main, @function
main:
pushl %ebp
movl %esp, %ebp
subl $8, %esp
andl $-16, %esp
movl $0, %eax

addl $15, %eax
addl $15, %eax
shrl $4, %eax
sall $4, %eax
subl %eax, %esp
subl $12, %esp
pushl $.LC0

call puts
addl $16, %esp
movl $0, %eax
leave
ret
.size main, .-main
.ident "GCC: (GNU) 4.0.0 20050519 (Red Hat 4.0.0-8)"
.section .note.GNU-stack,"",@progbits

(3)汇编阶段

汇编阶段是把编译阶段生成的”.s”文件转成目标文件。可使用选项”-c”就可看到汇编代码已转化为”.o”的二进制目标代码。如下所示:
命令:gcc –c helloworld.s –o helloworld.o

(4)链接阶段

在汇编阶段成功编译后,就是链接阶段。在这里涉及到一个重要的概念:函数库。

函数库一般分为静态库和动态库两种。

1、静态库是指编译链接时,把库文件的代码全部加入到可执行文件中,因此生成的文件比较大,但在运行时也就不再需要库文件了。其后缀名一般为”.a”

2、动态态库与之相反,在编译链接时并没有把库文件的代码加入到可执行文件中,而是在程序执行时由运行时链接文件加载库,这样可以节省系统的开销。一般后缀名为”.so”。如前面所述的libc.so.6就是动态库(按照约定,所有动态库文件名的形式是libname.so,可能在名字中加入版本号)。gcc在编译时默认使用动态库。    

我们知道源程序中并没有定义”printf”的函数实现,并且在预编译中包含进的”stdio.h”中也只有该函数的声明,而没有该函数的实现,那么,是在哪里实现”printf”函数的呢?答案是:系统把这些函数实现都被做到名为libc.so.6的库文件中去了。在没有特别指定时,gcc在链接时会到系统默认的搜索路径”/usr/lib”下进行查找库文件并链接,这里就是链接到libc.so.6库函数中去,于是就实现函数”printf” 了,而这也就是链接的作用
完成了链接之后,gcc就可以生成可执行文件,如下所示。

命令:gcc hello.o –o hello

运行该可执行文件,结果如下。
[root@localhost ~]# ./hello
Hello World!

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值