预编译
预编译:(处理所有预编译的指令如 #inclue #if #endif #define #ifdef 等)
(1)宏替换
(2)头文件的引入
(3)注释的替换(用空格替换)
(4)添加行号和文件名标识
编译
(1)词法分析
将代码分割成一系列的符号,将符号分类(关键字 标识符 字面量 字符串等 )同时扫描器将符号添加到符号表中
(2)语法分析
语法分析器对扫描器产生的符号进行分析产生语法树(上下文无关语法)语法分析确定表达式的含义。语法错误在这个阶段会被检查出来(函数参数不对,括号不匹配,缺少操作数等)
(3)语义分析
完成对表达式层面的语法分析(只能分析静态语义,表达式,指针相乘或指针与浮点数相乘检查不出来)静态语义(类型是否匹配,类型的转换)经过语义分析,语法树都加上了类型
(4)优化代码并产生相应的汇编代码文件
源码级优化器将整个语法树转换成中间代码,中间代码使得编译器可以分为前端和后端,前端负责产生机器无关的中间代码,后端将中间代码转换成目标机器代码,编译器后端包括代码生成器和目标代码优化器,代码生成器将中间代码转换为目标代码,目标代码优化器对目标代码进行优化,比如选择适当的寻址方式,使用移位来代替乘法运算,删除多余指令。
汇编
源程序被编译后主要分为两种段 ,程序指令和程序数据,代码段属于程序指令,数据段和.bss 属于程序数据
汇编生成目标文件windows 下生成*.obj文件 linux 下生成*.o 文件,经过汇编后的机器指令放在.text段,初始化的全局变量、静态变量放在.data段,未初始化的全局变量放在.bss段,目标文件中还包括符号表、调试信息、字符串等。
在下面的代码中我们分析一下程序数据与程序指令所在的段
#include <stdio.h>