【编译系统】【第一讲、绪论】

最新推荐文章于 2024-05-15 16:15:51 发布

red1y

最新推荐文章于 2024-05-15 16:15:51 发布

阅读量815

点赞数

分类专栏：编译系统文章标签：编译器

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39578432/article/details/123057422

版权

编译系统专栏收录该内容

9 篇文章 0 订阅

订阅专栏

1.1 什么是编译

编译：将高级语言(源语言)翻译成汇编语言或机器语言(目的语言)的过程
源程序 $\xrightarrow{预处理器(Preprocessor)}$ 经过处理的源程序 $\xrightarrow{编译器}$ 汇编语言程序 $\xrightarrow{汇编器(Assembler)}$ 可重定位的机器代码 $\xrightarrow{链接器(Linker)/加载器(Loader)}$ 目标机器代码

1.2 编译系统的结构

人工翻译的例子： $\xrightarrow{源语言句子}$ 分析源语言(语义分析) $\xrightarrow{句子的语义}$ 生成目标语言 $\xrightarrow{目标语言句子}$
语义分析(Semantic Analysis)：划分句子成分，通过短语
语法分析(Syntax Analysis)：识别各类短语，通过词性
词法分析(Lexical Analysis)：识别词性
中间表示：独立于具体语言
编译器的结构(阶段)： $\xrightarrow{字符流}$ 词法分析器 $\xrightarrow{词法单元流}$ 语法分析器 $\xrightarrow{语法树}$ 语义分析器 $\xrightarrow{语法树}$ 中间代码生成器 $\xrightarrow{中间表示形式}$ 机器无关代码优化器 $\xrightarrow{中间表示形式}$ 目标代码生成器 $\xrightarrow{目标机器语言}$ 机器相关代码优化器 $\xrightarrow{目标机器语言}$
1. 分析部分/前端(front end)：中间代码生成器之前，与源语言相关
2. 综合部分/后端(back end)：中间表示形式之后，与目标语言相关
语法制导翻译(Syntax Directed Translation)：在语法分析的同时进行语义分析

1.3 词法分析概述

源程序 $\xrightarrow{从左向右逐行扫描，识别各个单词，确定单词类型}$ 词法单元(token)集合
token：< 种别码，属性值 >
1. 关键字：program、if 等，一词一码
2. 标识符：变量名、数组名等，多词一码，通过属性值区别不同标识符
3. 常量：整型、字符型等，一型一码
4. 运算符：算数、关系等，一词一码或一型一码
5. 界限符：一词一码
  
  注：对于事先可以完全确定的类型，可以为每一个值分配一个码；对于开放集合不能枚举，需要属性值加以标记
词法分析举例：While(value!=100){num++}
1. while： $< W H I L E, - >$
2. (： $< S L P, - >$
3. value： $< I D N, v a l u e >$
4. !=： $< N E, - >$
5. 100： $< C O N S T, 100 >$
6. )： $< S R P, - >$
7. {： $< L P, - >$
8. num： $< I D N, n u m >$
9. ++： $< I N C, - >$
10. ;： $< S E M I, - >$
11. }： $< R P, - >$
实现词法分析器：第三章

1.4 语法分析概述

token 序列 $\xrightarrow{识别各类短语，构造语法分析树}$ 语法分析树(parse tree)
赋值语句的分析树：position = initial + rate * 60
变量声明语句的分析树：int a,b,c
根据语法规则为输入句子构造分析树：第四章

1.5 语义分析概述

收集标识符的属性信息：存放在符号表(Symbol Table)
1. 种属(Kind)：简单变量、复合变量(数组等)
2. 类型(Type)：整型、字符型等
3. 存储位置、长度
4. 值
5. 作用域
6. 参数和返回值信息
  
  符号表：(NAME, TYPE, KIND, VAL, ADDR)，附带字符串表记录NAME值
语义检查
1. 变量或过程未经声明就使用
2. 变量或过程重复声明
3. 运算分量类型不匹配
4. 操作符与操作数类型不匹配

1.6 中间代码生成

常用的中间表示形式：三地址码(Three-address Code)，语法结构树/语法树(Syntax Trees)
三地址码：
- 三地址：源程序中的名字、常量、编译器生成的临时变量
- 三地址指令表示：
  1. 四元式(Quardruples)：(op, y, z, x)
  2. 三元式(Triples)
  3. 间接三元式(Indirect triples)
举例
根据分析树生成中间代码：第六章

1.7 编译器后端概述

目标代码生成：中间表示形式 $\rightarrow$ 目标语言
- 重要任务：为程序中使用的变量合理分配寄存器
代码优化：等价程序变换，是程序运行更快、占用空间更少
- 减少冗余运算
- 替换高代价运算
详细介绍：第八、九章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【编译系统】【第一讲、绪论】

1.1 什么是编译编译：将高级语言(源语言)翻译成汇编语言或机器语言(目的语言)的过程源程序 →预处理器(Preprocessor)\xrightarrow{预处理器(Preprocessor)}预处理器(Preprocessor) 经过处理的源程序 →编译器\xrightarrow{编译器}编译器汇编语言程序 →汇编器(Assembler)\xrightarrow{汇编器(Assembler)}汇编器(Assembler) 可重定位的机器代码 →链接器(Linker)/加载器(Loader)
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。