编译原理
1.1
编译器就是个程序,读入某种语言编写的程序,翻译成另一种语言的程序。并能告知源程序的错误。
1.11 编译的分析综合模型
编译由两部分组成,分析和综合。
分析部分将源程序切分成一些基本块并形成源程序的中间表示,综合部分把源程序的中间表示转换成目标程序。
分析期间:
源程序的操作将被确定下来并表示成为一个语法树的分层结构:
赋值语句 Position :=initial + rate * 60; 语法树如下图所示:
1.12 编译器的前驱和后继
源程序可能被分成模块存在不同的文件中,把存储在不同文件中的程序模块集成为完整的一个源程序的任务由预处理器完成,当然预处理器也能进行宏替换。
典型的“编译”过程如下图所示:由编译器创建的目标程序需要进一步处理才能运行。左图中编译器产生汇编代码,汇编代码需要由汇编器翻译成机器代码,然后与库程序连接在一起形成可在计算机上机运行的代码。
1.2 源程序分析
源程序的分析过程由 3 个阶段组成:
1. 线形分析
在编译器中,线性分析被称为词法分析或扫描
2. 层次分析
层次分析被称为语法分析
3. 语义分析
语义分析阶段检测源程序的语义错误,并收集代码生成阶段要用到的类型信息。
1.3 编译器的各个阶段
从概念讲,编译器是分阶段的,每个阶段将源程序从一种表示转换成另一种表示。
1.31 符号表管理器
符号表是一个数据结构。每个标志符在符号表都有一条记录,记录的每个域对应于该标志服的一个属性。但是标志符属性一般不再词法分析中确定。将在词法分析以后的各个阶段陆续写入符号表,并以各种方式被使用。
1.33 各阶段分析
编译最后一个阶段为目标代码生成,生成可重定为的机器代码或者汇编代码。在这一阶段,编译器为源程序定义和使用的变量选择存储单元,并把中间指令翻译完成相同任务的机器代码指令序列。
gcc 中: gcc -S a.i -o a.s 能够生成汇编代码
1.4 编译器的伙伴
1.41 预处理器
预处理器产生编译器的输入,一般具有以下的功能:
1. 宏处理
2. 文件包含
把头文件包含到程序正文中
3. 理性预处理器
4. 语言扩充
gcc 中: gcc -E a.c -o a.i 产生预处理后的文件a.i,能看到宏的扩展
1.42 汇编器
某些编译器产生汇编代码,汇编代码需要汇编器做进一步处理。也有些编译器完成汇编的操作,产生可重定为的机器代码,交给装配器或者连接编辑器处理。
1.43 两编汇编
最简单的汇编对输入汇编程序文件进行两遍扫描,第一遍扫描中,表示存储单元的所有标志符都被识别出来,并存入符号表(汇编器的符号表)。假定标志符占 4 个字节,且从 0 地址开始。
在第二遍扫描中,汇编器再次从头扫描输入文件。这一次将每个操作符翻译成机器代码中代表相应操作的二进制位序列。第二遍扫描的输出是可重定位的机器代码。可重定为指的是装入的起始地址可以是任意的内存单元 Lc, 也就是说,如果将 L 加到代码的所有地址上,整个程序对所有存储地址的引用都是正确的。
gcc 中: as a.s -o a.o 生成目标文件
1.44 装配器和连接编辑器
装配器完成程序的装入和连接编辑两项功能。装入过程包括读入可重定为的机器代码,修改重定为地址,并将修改后的指令和数据放到内存中适当的位置。
连接编辑器将我们多个可重入机器代码的文件组装成一个程序。这些可重入机器代码的文件可以是多次编译的结果,其中一个或多个可能是库文件程序。
外部引用:一个文件中的代码引用另一个文件中的存储单元,这种引用可以是数据单元的引用,或者是出现在一个文件中代码而在另一个文件中被调用的过程的入口点的引用。
gcc 中: gcc a.o -o a.out 生成执行代码