序
一个编译过程包括下面4个阶段
预处理,预处理器CPP主要进行3个方面:文件包含、宏定义、条件编译;
编译,gcc将c文件编译成汇编文件;
汇编,as将汇编文件编译成机器码;
链接,ld将目标文件和外部符号进行链接,得到一个可执行二进制文件。
下面以一个简单的test.c来探讨这个过程
#define NUMBER (1+2)
int main(void)
{int num =NUMBER;return 0;
}
1、预处理
预处理主要做下列的处理
将所有的#define删除,并且展开所有的宏定义
处理所有的条件预编译指令,比如#if #ifdef #elif #else #endif等
处理#include 预编译指令,将被包含的文件插入到该预编译指令的位置。
删除所有注释 “//”和”/* */”.
添加行号和文件标识,以便编译时产生调试用的行号及编译错误警告行号。
保留所有的#pragma编译器指令,因为编译器需要使用它们
[root@localhost test]# gcc -E test.c > test.i //等价于 cpp test.c >test.i[root@localhost test]# cat test.i
#1 "test.c"#1 ""#1 ""#1 "test.c" //使用gcc -E -P test.c > test.i 就不会显示上面4行#号开头的内容int main(void)
{
int num= (1+2); //这里进行了行宏替换return0;}
2、编译
预处理后的代码生成汇编代码.
编译过程可分为6步:扫描(词法分析)、语法分析、语义分析、源代码优化、代码生成、目标代码优化。
词法分析:扫描器(Scanner)将源代码的字符序列分割成一系列的记号(Token)。lex工具可实现词法扫描。
语法分析:语法分析器将记号(Token)产生语法树(Syntax Tree)。yacc工具可实现语法分析。
语义分析:静态语义(在编译器可以确定的语义)、动态语义(只能在运行期才能确定的语义)。