后续会更新编译原理其他章节(有问题请指正)
文章目录
前言
参考了《编译原理》王生原,张素琴等编 清华大学出版社
一、程序设计语言的发展
机器语言->汇编语言->程序设计语言
1、机器语言
机器指令集合称为机器语言。机器指令即二进制数,通常由若干字节构成。
①优点
- 计算机可直接识别执行
- 可充分利用硬件特性
②缺点
- 可读性差
- 指令系统随机种而异
- 由于机器指令直接或间接含有绝对地址,增加或减少一条指令,可能会引起多条指令的修改。
- 编程者需协调内存的使用
所以,机器语言形式的程序编制和维护困难,限制了计算机的推广和应用。
2、汇编语言
用记忆符取代二进制位,存储地址和汇编语句的序号可用符号名表示。
①优点
- 用符号取代二进制数,提高了程序的可理解性。
- 性能较好的汇编语言,可用符号名来表示存储地址和汇编语句序号,这样避免了在汇编语句中绝对地址的出现。
- 可充分利用硬件特性
所以,汇编语言在一定程度上降低了程序编制和维护的难度。
②缺点
- 汇编语句和机器指令基本上是一对一的,所以汇编语言的编程效率并没有质的提高。
- 和机器语言一样,汇编语言依附于目标计算机。
- 需汇编程序,将汇编语言译成机器语言。
3、程序设计语言
程序设计语言又称高级语言。程序设计语言接近于英语,相当于工程语言。目前计算机系统一般含有多个程序设计语言的翻译程序(例VC、VB等),甚至对同一个程序设计语言配备了多个不同性能的翻译程序,供用户选择使用。
①优点
- 独立于具体计算机,面向过程(函数)或对象。
- 程序设计语言接近于英语,可理解性好。
- 数据类型丰富,各种功能的语句齐备,一条语句至少相当于几十条汇编语句。
所以,程序设计语言极大地提高了编程效率,大幅度地降低了编程难度。
②缺点
- 需翻译程序,将高级语言译成机器语言或汇编语言。
- 对硬件操作困难,高级语言通常提供汇编语言接口。
二、基本术语解释
源程序:用程序设计语言书写的程序
源语言:程序设计语言
2、文本文件
.txt文件
3、目标语言和目标程序
目标语言:可以是机器语言(二进制数),也可以是汇编语言(字符),或者是其它中间语言(字符),但最终结果必定是机器语言。
目标程序:经翻译程序加工后用目标语言表示的程序。
4、二进制文件
二进制文件由机器指令即二进制数构成,扩展名通常为EXE。
5、翻译程序
将源程序译成逻辑上等价的目标程序的程序。翻译程序有二种工作方式:编译和解释。
①解释方式(Interpret)
以源程序作为输入,输入一句解释执行一句,不产生完整的目标程序,相应的翻译程序称为解释程序(Interpreter) 。
主要特点:用户程序是消极的,用户程序的执行离不开解释程序。
②编译方式(Compile)
将源程序全部译为目标程序,该目标程序可在操作系统环境下直接执行,相应的翻译程序称为编译程序(Compiler)
主要特点:用户程序是积极的。用户程序执行时,控制点在用户程序自身。除操作系统外,程序运行无需其它支撑软件。
6、软件
计算机系统中的程序及其文档
7、系统软件
居于计算机系统中最靠近硬件的一层,其他软件一般都通过系统软件发挥作用。它和具体的应用领域无关,如编译系统和操作系统等。
8、语言处理系统
把软件语言书写的各种程序处理成可在计算机上执行的程序。
9、软件语言
用于书写软件的语言。它主要包括需求定义语言,功能性语言,设计性语言,程序设计语言以及文档语言。
10、翻译程序
将源语言程序转换为目标语言程序的等价的程序称为翻译程序。
11、编译程序
将高级语言源程序翻译为低级语言目标程序的程序称为编译程序。
编译程序的工作过程一般划分为五个阶段:
目标代码生成
(1)词法分析
任务:从左至右读字符流的源程序,识别(拼)单词。
【单词】单词是具有独立意义的最小语法单位。
多数程序语言中,单词符号一般包括 —各类型的常数、保留字、标识符、运算符、界符等等。
识别原则:词法规则
描述工具:正规式
正规文法
有穷自动机FA
自动生成工具:LEX
(2)语法分析
任务:依据源程序的语法规则把源程序的单词序列组成更大的语法成分——“组词成句” (表示成语法树) 。
识别原则:语法规则
描述工具:上下文无关文法
下推自动机PDA
自动生成工具:YACC
(3)语义分析与中间代码生成
任务:对语法分析所识别出的各类语法范畴,分析其含义,并进行初步翻译(产生中间代码)。
语义审查(静态语义):上下文相关性、类型匹配、类型转换
识别原则:语义规则
描述工具:属性文法
实现方法:语法制导翻译
【中间代码】 是一种含义明确、便于处理的记号系统,它通常独立于具体的硬件。这种记号系统或者与现代计算机的指令形式有某种程度的接近,或者能够比较容易地把它变换成现代计算机的机器指令。
(4)代码优化
任务:对前段产生的中间代码进行加工变换,以期在最后阶段能产生出更为高效(省时间和空间)的目标代码。
主要包括:公共子表达式的提取
循环优化
删除无用代码等等
优化所依循的原则:程序的等价变换规则。
(5)目标代码生成
任务:把中间代码(或经优化处理之后)变换成特定机器上的低级语言代码。
生成原则:硬件系统结构和机器指令含义。
目标代码的形式:
绝对指令代码
可重定位的指令代码
汇编指令代码