1. 初始编译器
2. 预编译:指令示例——gcc –E file.c –o file.i
- 处理所有的注释,以空格代替
- 将所有的#define删除,并且展开所有的宏定义
- 处理条件编译指令#if、#ifdef、#elif、#else、#endif
- 处理#include,展开被包含的文件
- 保留编译器需要使用的#pragma指令
3. 编译:指令示例——gcc –S file.i –o file.s
- 对预处理文件进行词法分析、语法分析和语义分析
- 词法分析:分析关键字、标识符、立即数等是否合法
- 语法分析:分析表达式是否遵循语法规则
- 语义分析:在语法分析的基础上进一步分析表达式是否合法
- 分析结束后进行代码优化生成相应的汇编代码文件
4. 汇编:指令示例——gcc –c file.s –o file.o
- 汇编器将汇编代码转变为机器可以执行的指令
- 每条汇编语句几乎都对应一条机器指令
5.编程实验
- 源代码单步编译示例
- test.h
/*
This is a header file.
*/
char* p = "Hello World!";
int i = 0;
- test.c
#include "19-1.h"
// Begin to define macro
#define GREETING "Hello world!"
#define INC(x) x++
// End
int main()
{
p = GREETING;
INC(i);
return 0;
}
- 第1步:预处理——gcc -E test.c -o test.i
# 1 "19-1.c"
# 1 "<built-in>"
# 1 "<command-line>"
# 1 "test.c"
# 1 "test.h" 1
char* p = "Hello World!";
int i = 0;
# 2 "test.c" 2
# 11 "test.c"
int main()
{
p = "Hello world!";
i++;
return 0;
}
- 第2步:编译——gcc -S test.i -o test.s
- 编译的源文件来自预编译的输出文件(test.i),编译后输出的文件为test.s
.file "test.c"
.globl p
.section .rodata
.LC0:
.string "Hello World!"
.data
.align 4
.type p, @object
.size p, 4
p:
.long .LC0
.globl i
.bss
.align 4
.type i, @object
.size i, 4
i:
.zero 4
.section .rodata
.LC1:
.string "Hello world!"
.text
.globl main
.type main, @function
main:
pushl %ebp
movl %esp, %ebp
movl $.LC1, p
movl i, %eax
addl $1, %eax
movl %eax, i
movl $0, %eax
popl %ebp
ret
.size main, .-main
.ident "GCC: (Ubuntu/Linaro 4.4.4-14ubuntu5.1) 4.4.5"
.section .note.GNU-stack,"",@progbits
- 第3步:汇编——gcc -c test.s -o test.o
- 在第3步,会生成test.c文件对应的目标文件,本例中为test.o,这是一个二进制代码的文件
- 第4步:链接——gcc test.o
- 第4步后就会生成可执行文件
5. 小结——编译过程的四个阶段:预处理、编译、汇编和链接
- 预处理:处理注释、宏以及以#开头的符号
- 编译:进行词法分析、语法分析和语义分析等
- 汇编:将汇编代码翻译为机器指令的目标文件