编译原理
编译器结构:(目标程序为汇编语言)
每个阶段将源程序从一种表示转换成另一种表示。
随着编译器各个阶段的进展,源程序的内部表示不断地发生变化。
-
词法分析器:字符流->单词流
-
语法分析器:单词流->语法树
-
语义分析器:
收集标识符的属性信息:
类型(Type)
种属(Kind)
存储位置、长度
值
作用域
参数和返回值信息
语义检查:
变量或过程未经声明就使用
变量或过程名重复声明
运算分量类型不匹配
操作符与操作数之间的类型不匹配 -
中间代码生成器:抽象语法树->中间表示(与平台无关的抽象程序)
易于产生
易于翻译成目标程序
三地址码:temp1=cd;temp2=b+temp1;a=temp2
四元式:(op, arg1, arg2, result);( , c , d , temp1);(+ , b, temp1 , temp2);(= , temp2 , - , a) -
代码优化器:试图改进中间代码,以产生执行速度较快的机器代码
temp1=cd;temp2=b+temp1;a=temp2
change to:temp1=cd;a=b+temp1
代码生成器:生成可重定位的机器代码或汇编代码
temp1=c*d;a=b+temp1
change to:Mov R2,c;Mul R2, d;Mov R1, b;Add R2, R1;Mov a, R2
一个重要任务是为程序中使用的变量合理分配寄存器 -
符号管理表:
基本功能是记录源程序中使用的标识符,
并收集与每个标识符相关的各种属性信息,
并将它们记载到符号表中。 -
错误处理器:
处理方式:报告错误,应继续编译
大部分错误在语法分析、语义分析阶段检测出来
词法分析:字符无法构成合法单词
语法分析:单词流违反语法结构规则
语义分析:语法结构正确,但无实际意义
gcc与g++区别
简单来说,gcc与g++都是GNU(组织)的一个编译器。需要注意以下几点:
(1)gcc与g++都可以编译c代码与c++代码。但是:后缀为.c的,gcc把它当做C程序,而g++当做是C++程序;后缀为.cpp的,两者都会认为是C++程序。
(2)编译阶段,g++会调用gcc,对于c++代码,两者是等价的,但是因为gcc命令不能自动和C++程序使用的库联接,所以通常用g++来完成链接。
(3)编译可以用gcc/g++,而链接可以用g++或者gcc -lstdc++。因为gcc命令不能自动和C++程序使用的库联接(当然可以选择手动链接,使用命令如下),所以通常使用g++来完成联接。但在编译阶段,g++会自动调用gcc,二者等价。
gcc main1.cpp -lstdc++
gcc编译的四个步骤, 以最简单的helloWorld.c为例子
一步到位:gcc helloWorld.c
这条命令隐含执行了
(1)预处理
(2)编译
(3)汇编
(4)链接
这里未指定输出文件,默认输出为a.out
gcc编译C源码有四个步骤:
预处理 ----> 编译 ----> 汇编 ----> 链接
现在我们就用gcc的命令选项来逐个剖析gcc过程。
1. 预处理(Pre-processing)
在该阶段,编译器将C源代码中的包含的头文件如stdio.h添加进来
参数:”-E”
用法:gcc -E helloWorld.c -o helloWorld.i
作用:将helloWorld.c预处理输出helloWorld.i文件。
2. 编译(Compiling)
第二步进行的是编译阶段,在这个阶段中,gcc首先要检查代码的规范性、是否有语法错误等,以确定代码的实际要做的工作,在检查无误后,gcc把代码翻译成汇编语言。
参数:”-S”
用法:gcc –S helloWorld.i –o helloWorld.s
作用:将预处理输出文件helloWorld.i汇编成helloWorld.s文件。
3. 汇编(Assembling)
汇编阶段是把编译阶段生成的”.s”文件转成二进制目标代码“.o”文件
参数:“-c”
用法:gcc –c helloWorld.s –o helloWorld.o
作用:将汇编输出文件helloWorld.s编译输出helloWorld.o文件。
4. 链接(Link)
在成功编译之后,就进入了链接阶段。
用法:gcc helloWorld.o –o helloWorld
作用:将编译输出文件helloWorld.o链接成最终可执行文件helloWorld。
运行该可执行文件,出现正确的结果如下。
>>> ./helloWorld
Hello World!