编译原理
第一章
1.1 程序设计语言和编译程序
计算机指令系统
-
计算机所能执行的每一种操作称为一条指令,计算机能够执行的全部指令集合就是该计算机的指令系统。
-
指令格式:操作码 操作地址码
机器语言
-
二进制形式的指令序列成为某计算机的机器语言,也是计算机唯一能够直接识别并执行的语言。
-
优点:直接执行,速度快,资源占用少
-
确定:可读性、可移植性差,编程繁杂
-
汇编语言
-
用助记符代替机器语言的二进制指令
-
例如用“LOAD”代替“000”,用“STORT”代替“0001”等
-
汇编语言比机器语言有了长足的进步,但仍存在以下缺点:
-
严重依赖目标机器;
-
不易开发、调试;
-
和自然语言表达习惯相去甚远,可读性差
-
高级语言
-
高级语言已经从具体机器中抽象出来,拜托了依赖具体机器的问题。
-
高级语言虽然更符合人类的思维习惯,但高级语言程序也必须翻译(编译)成最终能够直接执行的机器语言程序。而且,难度比汇编过程大很多。
翻译
-
是指将某种语言的源程序,在不该变语义(逻辑上等价)的条件下,转换成另一种语言程序——目标语言程序
-
编译:专指由高级语言程序一次性转换成低级语言程序,类似于全文翻译
-
解释:接收某高级语言的一个语句输入,进行解释并控制计算机执行,得到这个语句的执行结果后,等待下一个语句的解释执行,执行过程中并部产生目标程序。类似于口译
编译型高级语言程序的阶段
-
高级语言程序的执行通常分为两个阶段:编译阶段和运行阶段。
高级语言程序的执行阶段分为三个阶段的情况:编译阶段、汇编阶段 和运行阶段。
高级语言程序的编译过程
-
输入:源程序, 输出:目标程序
-
五个阶段:词法分析、语法分析、语义分析和中间代码生成、中间代码优化、目标代码生成
1.词法分析的任务:遵循语言的构词规则将源程序中的字符串变换成单词符号流(通常使用上下文无关文法)。
2.语法分析的任务:根据语法规则,从单词符号串中识别出各种语法单位(如表达式、说明、程序段等),并检查语法结构的正确性(可以生成语法树)。
3.语义分析和中间代码生成的任务:(把语法单位翻译成中间代码,遵循语言的语义规则)
-
对每种语法单位进行静态语义审查(严重语法结构合法的程序是否真正有意义)
-
在语义检查正确的情况下进行中间代码的翻译
-
中间代码是介于高级语言语句和低级语言的指令之间的一种独立于具体硬件的记号系统,既有一定抽象,又与低级语言指令十分接近,因此转换成目标代码比较容易。
-
中间代码的常用表示形式:四元式、三元式、间接三元式和逆波兰记号等
4.中间代码优化的任务:
-
对前阶段产生的中间代码进行等价变换或改造,以期获得更为搞笑的目标代码。
-
优化遵循等价变换规则
5.目标代码生成的任务:
-
把中间代码变换成特定机器上的机器语言代码或汇编语言代码,实现最终的翻译工作。
-
该阶段的工作依赖硬件以及指令系统
编译程序的各个阶段需要构造、查找、更新变量和函数的信息,表格管理耗费了编译过程的绝大部分时间。
编译程序的开发技术
-
自贬意
-
交叉编译
-
自展
-
移植
第二章 词法分析
状态转换图的概念
正规表达式的概念和运算
词法分析器的处理结构有两种:
第一种:词法分析器和语法分析器完全分开
-
词法分析器的输出作为语法分析器的输入;将词法分析工作作为独立的一边来完成,在这个过程中不断查询和完善符号表。
第二种:词法分析器作为语法分析器调用的子程序
-
每当语法分析器需要一个单词时便调用词法分析器
-
词法分析和语法分析交替进行
单词符号的分类与输出形式
-
分类:保留字、标识符、常数、运算符、界符
-
输出形式: 单词种别、单词自身的值
状态转换图
在词法分析中,可以用状态转换图来识别单词。状态转换图是状态有限的有向图,结点代表状态,用圆圈表示;结点之间可由有向边连接,代表状态转换关系,有向边上可标记字符,表示前一状态接受某一个字符之后的状态转移。
正则表达式与有限自动机
字母表:语言元素的非空有穷集合,通常用\sum来表示
符号:字母表重的每一个元素,也叫字符
符号串:由符号组成的有穷序列,也叫字
空字:长度为0的字,用\epsilon表示
字的全体:所有字组成的集合\sum*
空语言:不含有任何字的语言{} ,用 \Phi 来表示
注意区分空字、空语言和空集\epsilon 、{}和{\epsilon}:
\epsilon是空字,是语言字的集合中的一个元素,不是\sum的元素
{ }不包含任何字,属于集合的概念=\Phi
{\epsilon }由空子组成的集合,这个集合比{}多一个元素
所谓形式化的方法,是指用一整套带有严格规定的符号体系来描述问题的方法,优点:更加清晰和准确;能够表示的单词集合称为正规集
三条规则:
1.(基础规则)从普通的符号产生对应的正规式和正规集
2.(归纳规则)根据已有的正规式和正规集生成其他正规式和正规集
3.(终止规则)根据已有的正规式和正规集生成其他正规式和正规集
第三章 语法分析
第四章