编译原理 词法分析

本文深入探讨编译原理中的正规文法与正规式,包括它们之间的关系和等价性。接着,介绍了确定性有穷自动机(DFA)和非确定性有穷自动机(NFA)的概念,以及如何进行NFA的确定化算法。最后,重点讨论了词法分析,阐述了正规表达式与有限自动机的等价性,以及词法分析在编译过程中的作用。
摘要由CSDN通过智能技术生成

文章目录
一、正规文法和正规式
1、文法与自动机的关系
2、正规文法与正规式
3、正规式等价
4、正规式到正规文法
5、正规文法到正规式
二、自动机
1、DFA : 确定的有穷自动机
2、NFA : 不确定的有穷自动机
3、NFA确定化算法
4、构造NFA N状态K的子集的算法
5、确定有穷自动机(DFA)化简
6、DFA的最小化算法
三、词法分析
1、正规表达式与有限自动机的等价性
2、正规文法与有限自动机的等价性
3、词法分析
一、正规文法和正规式
1、文法与自动机的关系
在这里插入图片描述

0型文法(短语结构文法):其能力相当于图灵机,可以表征任何递归可枚举集,而且任何0型语言都是递归可枚举的。

1型文法(上下文有关文法CSG):产生式的形式为α 1 A α 2 → α 1 β α 2 α_1Aα_2→α_1βα_2α
1


2

→α
1

βα
2

,即只有A AA 出现在 α 1 α_1α
1

和 α 2 α_2α
2

的上下文中时,才允许 β ββ 取代 A AA 。其识别系统是线性有界自动机。

2型文法(上下文无关文法CFG):产生式的形式为 A → β A→βA→β,β ββ取代A AA时与A AA的上下文无关。其识别系统是不确定的下推自动机。

3型文法(正规文法RG):产生的语言是有穷自动机(FA)所接受的集合。

2、正规文法与正规式
单词符号结构的描述方法:

正规文法(3型文法)
正规式(正则表达式)
正规表达式(正则表达式)(regular expression)
是说明单词模式(pattern)的一种重要的表示法(记号), 是定义正规集的数学工具。

在编译中,用以描述单词符号。

定义(正规式和它所表示的正规集):
设字母表为 ∑ ∑∑,辅助字母表∑ ′ = { Φ , ε , ∣ , • , ∗ , ( , ) } ∑’={ Φ,ε,|,•,*,(,)}∑

={Φ,ε,∣,•,∗,(,)}

Φ ΦΦ 和 ε εε 都是 ∑ ∑∑ 上的正规式,它们所表示的正规集分别为 ε {ε}ε 和 { } {}{} ;
任何 a ∈ ∑ a∈∑a∈∑,a aa 是 ∑ ∑∑ 上的一个正规式,它所表示的正规集为 a {a}a ;
假定e 1 e_1e
1

和 e 2 e_2e
2

都是 ∑ ∑∑ 上的正规式,它们所表示的正规集分别为 L ( e 1 ) L(e_1)L(e
1

) 和L ( e 2 ) L(e_2)L(e
2

) ,那么,( e 1 ) (e_1)(e
1

) , e 1 ∣ e 2 e_1| e_2e
1

∣e
2

, e 1 • e 2 e_1•e_2e
1

•e
2

, e ∗ e^e

也都是正规式,它们所表示的正规集分别为L ( e 1 ) L(e_1)L(e
1

), L ( e 1 ) ∪ L ( e 2 ) L(e_1)∪L(e_2)L(e
1

)∪L(e
2

), L ( e 1 ) L ( e 2 ) L(e_1)L(e_2)L(e
1

)L(e
2

) 和 ( L ( e 1 ) ) ∗ (L(e_

实验一 用PL/O语言编写用户源程序 (一)实验目的:  1了解运行TURBO PASCAL系统对计算机软硬件环境的要求。 2熟悉PASCAL系统中的基本语句及文件类型的使用方法。 3掌握PL/O语言源程序的结构及构成规则。 (二)实验内容与步骤  1用PL/0语言编写程序:建立和访问正文文件 2用PL/O语言编写能打印如下图形的程序 * * * * * * * * * * * * * * * * * * * * * * * * * 3用PL/O语言编写求3~100之间全部素数的程序。 4 将一正数倒置。 5 对任意给定的整数,列出其二进制、八进制、十六进制表示形式。 6深刻理解源程序、目标程序、编译程序的概念。 7用EBNF描述PL/O语言的程序结构及构成规则。 注:  实验二 构造识别符号串的自动机 (一)实验目的: 1掌握形式语言与自动机的概念 2了解正规集及有穷自动机的关系 3能构造识别相应符号串的自动机 4能构造词法分析程序所识别的各类单词的自动机 (二)实验步骤及内容: 1用高级语言编写程序:该程序能接受所有的标识符。 2用高级语言编写程序:该程序能接受所有的常数(整数和定点小数)。 3用高级语言编写程序:该程序能接受PL/0的所有保留字。 4 用高级语言编写程序:该程序能接受PL/0的所有界符、运算符。 (三)有关说明:  1高级及语言可选择 C语言实现。 2以上各程序要求:对输入的任意符号串能给出接受与否的识别信息。 实验三 词法分析程序的构造 (一)实验目的 1掌握PL/O编译程序的使用方法 2掌握PL/O编译程序的总体结构 3掌握PL/O编译程序的词法分析程序 4改编总控程序和词法分析程序 (二)实验内容及步骤 1单词的分类: 可将所有标识符归为一类;将常数归为另一类:保留字、界符、运算符符则可采取一词一类。 2符号表的建立 可事先建立一保留字表,以备识别保留字时进行查询。变量名表及常数表则在词法分析过程中建立。 3单词串的输出形式: 所输出的每一单词,均按形如(CLASS,VALUE)的二元式编码。对于变量标识符和常数,CLASS字段为相应的类别码,VALUE字段是该标识符、常数在其符号表中登记项的序号(要求在变量名表登记项中存放该标识符的字符串,其最大长度为四个字符;常数表登记项中则存放该常数(整数)的二进制形式)。对于保留字、界符和运算符,由于采用一词一类的编码方式,所以仅需在二元式的CLASS字段上放置相应的单词的类别码,VALUE字段则为“空”。(或:为便于查看由词法分析程序输出的单词串也可以在CLASS字段上放置单词符号串本身)。 4编写上述词法分析程序 (三)有关说明:  1该词法分析程序只能识别用PL/O语言书写的简单程序。 2也可改编PL/O的编译程序中的词法分析程序,使之能识别含repeat语句的程序。 
这个里面的都是测试数据,总共得分5分。从控制台输入,不能从文件中读取。实现了基本功能,加分项目都没有去实现,没有函数数组这些的实现。这是用C++语言写的,新建parser类别要选C++,其他对于VS的配置和C语言一样。for语句用的是枚举所有情况,你可以自行修改。 对预备工作中自然语言描述的简化C编译器的语言特性的语法,设计上下文无关文法进行描述 借助Yacc工具实现语法分析器 考虑语法树的构造: 1.语法树数据结构的设计:节点类型的设定,不同类型节点应保存哪些信息,多叉树的实现方式 2.实现辅助函数,完成节点创建、树创建等功能 3.利用辅助函数,修改上下文无关文法,设计翻译模式 4.修改Yacc程序,实现能构造语法树的分析器 考虑符号表处理的扩充 1.完成语法分析后,符号表项应增加哪些标识符的属性,保存语法分析的结果 2.如何扩充符号表数据结构,Yacc程序如何与Lex程序交互,正确填写符号表项 以一个简单的C源程序验证你的语法分析器,可以文本方式输出语法树结构,以节点编号输出父子关系,来验证分析器的正确性,如下例: main() { int a, b; if (a == 0) a = b + 1; } 可能的输出为: 0 : Type Specifier, integer, Children: 1 : ID Declaration, symbol: a Children: 2 : ID Declaration, symbol: b Children: 3 : Var Declaration, Children: 0 1 2 4 : ID Declaration, symbol: a Children: 5 : Const Declaration, value:0, Children: 6 : Expr, op: ==, Children: 4 5 7 : ID Declaration, symbol: a Children: 8 : ID Declaration, symbol: b Children: 9 : Const Declaration, value:1, Children: 10: Expr, op: +, Children: 8 9 11: Expr, op: =, Children: 7 10 12: if statement, Children: 6 11 13: compound statement, Children: 3 12
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值