编译原理MOOC笔记

最新推荐文章于 2023-03-03 09:30:00 发布

crabstew

最新推荐文章于 2023-03-03 09:30:00 发布

阅读量768

点赞数 4

分类专栏：编译原理文章标签：编译原理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/crabstew/article/details/104951931

版权

编译原理笔记

正规文法和正规式
词法分析
语法分析
语义分析与中间代码生成器
语音分析和中间代码生成

正规文法和正规式

正规式即正则表达式

正规文法为左线性或右线性文法

正规式和正规文法的定义

正规式转换为正规文法

正规文法转换为正规式

词法分析

源程序 -> 前端 -> 中间表示 -> 后端 -> 目标程序

前端

源程序 -> 词法分析器 -> 记号 -> 语法分析器 -> 抽象语法树 -> 语义分析器 -> 中间表示

词法分析器的任务

任务：字符流到记号流

字符流：和被编译的语言密切相关（ASCII，Unicode，or…）
记号流：编译器内部定义的数据结构，编码所识别出的词法单元

词法分析器的实现方法

手工编码实现法
相对复杂、且容易出错，但是是非常流行的实现方法（现在的编译器如GCC和LLVM就是手工编码）
词法分析器的生成器
快速、代码量少，但是难以控制细节

正则表达式

给定字符集 $\sum={c_1,c_2,...,c_n}$
归纳定义：
1. 空串 $\epsilon$ 是正则表达式
2. 对于任意 $c\in\sum$ , c是正则表达式
3. 如果M和N是正则表达式，则以下也是正则表达式
选择 $M | N= \{M, N\}$
连接 $\{mn | m\in M,n \in N \}$
闭包 $M*=\{\epsilon , M , MM, MMM, ...\}$

有限状态自动机

自动机={待补充}

字符串分为可被自动机接受的字符串和不可被自动机接受的字符串

可被自动机接受：可达到结束状态
不可被自动机接受：不可达到结束状态

确定的有限状态自动机：对任意字符，最多有一个状态可以转移
不确定的有限状态自动机：对任意的字符，有多于一个状态可以转移

正则表达式到非确定有限状态自动机

词法分析器自动生成的过程：

$\xrightarrow[]{Thompson算法} NFA \xrightarrow[]{子集构造算法} DFA \xrightarrow[]{Hopcroft最小化算法} 词法分析器代码$

最低0.47元/天解锁文章

关注

4
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
编译原理MOOC笔记

编译原理笔记词法分析前端词法分析器的任务词法分析器的实现方法正则表达式有限状态自动机正则表达式到非确定有限状态自动机词法分析源程序 -> 前端 -> 中间表示 -> 后端 -> 目标程序前端源程序 -> 词法分析器 -> 记号 -> 语法分析器 -> 抽象语法树 -> 语义分析器 -> 中间表示词法分析器的任务任务：字符流到...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。