背景知识
一般高级语言程序编译的过程:预处理、编译、汇编、链接。gcc在后台实际上也经历了这几个过程。
-
预处理(进行宏替换)
-
编译(生成汇编)
-
汇编(生成机器可识别代码)
-
连接(生成可执行文件或库文件)
gcc如何完成
格式: gcc [选项] 要编译的文件 [选项] [目标文件]
预处理(进行宏替换)
- 预处理功能主要包括:
- 将所有的"#define"删除,展开宏定义。
- 处理条件预编译指令,如:"#if" “#ifdef” “#endif”
- 将被包含的文件插入到"#include"预编译指令的位置
- 删除注释
- 添加行号,以便编译器产生调试用的行号和用于编译产生错误时的警告的行号
- 保留所有的#pragma编译器指令( 因为编译器需要使用它们 )
- 预处理指令是以#号开头的代码行。
- 实例:
gcc –E hello.c –o hello.i
- 选项“-E”,该选项的作用是让 gcc 在预处理结束后停止编译过程。
- 选项“-o”是指目标文件,“.i”文件为已经过预处理的C原始程序。
编译(生成汇编)
在这个阶段中,gcc 首先要检查代码的规范性、是否有语法错误、优化处理等,以确定代码的实际要做的工作,在检查无误后,gcc 把代码翻译成汇编语言。
- 用户可以使用“-S”选项来进行查看,该选项只进行编译而不进行汇编,生成汇编代码。
- 实例:
gcc –S hello.i –o hello.s
汇编(生成机器可识别代码)
汇编器将汇编代码转变成机器可以执行的指令,每一个汇编语言对应一条机器指令。
- 汇编阶段是把编译阶段生成的“.s”文件转成目标文件
- 在此可使用选项“-c”就可看到汇编代码已转化为“.o”的二进制目标代码了
- 实例:
gcc –c hello.s –o hello.o
链接(生成可执行文件或库文件)
把每个源代码模块独立的编译,然后按照要求将它们组装起来,使各个模块能够正常的衔接,这个组装的过程就是链接。
-
在成功编译之后,就进入了链接阶段。
-
实例:
gcc hello.o –o hello
编辑出来的 hello 文件默认是Release版本,想对 hello 文件进行调试,必须得 Debug 版本。
./hello // 程序运行
函数库
-
我们的C程序中,并没有定义“printf ”的函数实现,且在预编译中包含的“stdio.h”中也只有该函数的声明,而 没有定义函数的实现,那么,是在哪里实“printf ”函数的呢?
-
最后的答案是:系统把这些函数实现都被做到名为 libc.so.6 的库文件中去了,在没有特别指定时,gcc 会到 系统默认的搜索路径“/usr/lib”下进行查找,也就是链接到 libc.so.6 库函数中去,这样就能实现函数“printf ”了,而这也就是链接的作用
函数库一般分为静态库和动态库两种。
- 静态库是指编译链接时,把库文件的代码全部加入到可执行文件中,因此生成的文件比较大,但在运行时也 就不再需要库文件了。其后缀名一般为“.a”
- 动态库与之相反,在编译链接时并没有把库文件的代码加入到可执行文件中,而是在程序执行时由运行时 链接文件加载库,这样可以节省系统的开销。动态库一般后缀名为“.so”,如前面所述的 libc.so.6 就是动态 库。gcc 在编译时默认使用动态库。完成了链接之后,gcc 就可以生成可执行文件,如下所示。
gcc hello.o –o hello
- gcc默认生成的二进制程序,是动态链接的,这点可以通过
file
命令验证。
gcc选项
- -E 当前gcc只完成预处理阶段就会退出
- -S 当前gcc只完成编译阶段就会退出
- -c 当前gcc只完成汇编阶段就会退出
- -o 用于指定要生成的目标文件
- -g 生成debug版本程序
- -static 此选项对生成的文件采用静态链接
- -shared 此选项将尽量使用动态库,所以生成文件比较小,但是需要系统由动态库.
- -O0
- -O1
- -O2
- -O3 编译器的优化选项的4个级别,-O0表示没有优化,-O1为缺省值,-O3优化级别最高
- -w 不生成任何警告信息。
- -Wall 生成所有警告信息。
简单总结
gcc/g++:编译器
功能:将C/C++高级语言代码翻译成机器可识别代码
编译过程:
- 预处理:展开所有代码
- 编译:语法语义纠错,翻译成为汇编代码
- 汇编:将汇编代码翻译成二进制机器可识别指令
- 链接:将当前代码以及函数库中的代码打包生成可执行程序
- 函数库:将已经实现的代码打包生成一个文件(已经编译好的机器指令代码)
链接方式的分类
- 静态链接:链接静态库,将库中的代码直接全部拷贝到可执行程序当中,好处是程序运行时,不需要依赖库文件的存在;缺点是占用资源较多
- 动态链接:链接动态库,只是记录库中的接口符号位置信息,好处是资源占用冗余较小,缺点是程序运行时需要动态库的存在
gcc默认链接方式:动态链接
如有不同见解,欢迎留言讨论~~