编译原理复习一:正则表达式-NFA NFA-DFA DFA最小化(附题目与答案 超详细)

需要原卷和答案可以点赞关注收藏评论区留言私信

对题目解法有疑问也可留言

下面以具体考试题目来讲解编译原理考试中的重点题目,大致可以分为以下几道大题

1:正则表达式转换为NFA,NFA转换为DFA,DFA最小化

2:LR(0)分析,构造LR(0)自动机,进一步对SLR(1)进行分析,由于LR(1)状态数太多过于复杂,考试中一般不会手动构造

3:语义分析中注释语法树的构造与对节点求值

4:中间代码生成中的生成三地址码等等

下面着重讲解正则表达式转换为NFA,NFA转换为DFA,DFA最小化这三个过程,考试中通常作为一道大题的三个小问呈现,必须掌握

下面是一些基本概念的编译器结构的填空题

  1. Fill in the blanks 

a. Normally, A complier consists of a number of phases. They are Scanner, _________________, ______________________, ______________________, Code Generator, and ___________________.

b. The logical units the scanner generates are called Tokens. For a modern programming language, there are five types of token. They are ________________, _______________, __________________, ____________________, ________________.

 答案

a. __Grammar_Parser_, ____Sematic Analyzer___, __Source Code Optimizer_, _Target Code Optimizer _.

b.__Reserved Words____, ___Identifier______, ___Number____, ____Operator___, __Special Symbol__

c.

 a) “int” is a ___  Reserved Word  b) “printf” is a ___Reserved Word   c) “s” is a (an) _   Identifier __  

d) “= =” is a _____ Operator_____  e) “0”  is a______ Number_ ____

d. Terminal symbol Non-Terminal symbol,  start symbol ,and ___Product Rules

    1. Compiler —— 一种应用程序,将源代码转换为指定的目标代码。
    2. Source code —— 文本文件,其中内容是按照指定的文法规则描述特定的算法,
    3. Scanner —— 将文本字符串按照词法规则,转换为特定的内部标识,供编译器后续分析。
    4. Tokens ——源文件中最基本的信息单元
    5. Terminal symbol ——文法规则中不需要产生式定义的符号

Ambiguous Grammar —使用不同推导方法,推导出不同语法树,就称该文法为二义文法

一、正则表达式转换为NFA

Construct minimum-state DFA for the following regular expression:  a(b|ab)*, which includes:

Convert the regular express into NFA first

Convert the NFA into DFA

Minimize the state of DFA

让我们看看正则表达式是如何转换为NFA的,主要是对三个规则的应用,对正则表达式中连接,并,闭包三个运算的具体展开

答案如下

二、NFA转换为DFA 

接下来把NFA转换为DFA,一般用到的是子集构造法,这里博主用自己的话通俗易懂的描述以下

有一个表 表的列为输入符号和I

第一列第一行I填入从开始状态出发经过任意个空集能到达的状态 Ia Ib填从I中状态出发经过一个a或者一个b所能到达的状态,经过一个a或者一个b后后面可以跟任意个空集(注意空集必须出现在a或b的后面)

然后把第一行的Ia Ib填入第二行的I中,重复上面的规则,直至没有新状态加入I中,然后给I中状态重新编号即可 

 

新状态构造后的DFA如下 

 

 三、DFA最小化

DFA最小化一般就是进行状态的划分,把不可区分的状态分为一类

状态间可区分定义:两个状态输入同一个输入符号时,一个进入非接受状态,另一个进入接受状态则说这个输入符号区分这两个状态

一开始将状态划分为接受状态和非接受状态两类,然后反复运用上面规则直至不能划分即可

上述DFA最小化如下

 

 创作不易 觉得有帮助请点赞关注收藏~~~

  • 55
    点赞
  • 104
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
编译原理是学习计算机科学的一门基础课程,主要涉及语言的识别和转化,而正则表达式则是其中一个非常重要的工具。在编译原理中,正则表达式通常用于描述一些模式,比如关键字、标识符等。因此,掌握正则表达式的转换过程对于理解编译原理课程非常重要。 正则表达式的转换过程主要包括以下几个部分:正则表达式NFANFADFADFA最小化。其中,NFA(非确定有限状态自动机)和DFA(确定有限状态自动机)都是描述正则表达式的模型。 正则表达式NFA: 首先,正则表达式中的基本元素是字符、括号和运算符。在转换为NFA的过程中,需要设计出一些状态来描述不同的字符和运算符。 对于字符来说,我们可以为它们设计出一个状态,状态的入口边是字符,出口边为空。 对于括号和运算符来说,可以为它们设计出一些连接状态。例如在括号中的字符可以通过连接状态直接连接到后面的状态,或者通过其他运算符先连接到其他的状态再连接到后面的状态。 最后,需要定义一个起始状态和一个终止状态,起始状态与第一个字符状态相连,最后一个字符状态与终止状态相连。这样,我们就得到了一张NFA图。 NFADFA: 将一个NFA图转换成DFA图的主要目的是为了简化图结构,以便后续对文本进行识别。 首先,需要定义DFA的状态集合,每个集合都对应一个状态。因为DFA是完全确定的有限状态自动机,所以在DFA中只能有一个状态。 然后,需要将NFA图中的每个状态都映射为DFA图中的一个状态,以便对文本进行识别。当NFA图中有多个状态对应于DFA图中的同一状态时,需要将它们合并,并将它们的出口边合并成一个出口边。 DFA最小化: 最后,对DFA进行最小化处理,以便减少状态数,提高运行效率。在最小化处理时需要考虑不同状态之间的等价关系。 可以采用遍历算法,将DFA中的状态按照等价关系划分为若干个等价类,然后构造一个等价类访问表,每个表项对应一个状态集。 最小化后的DFA图是可以识别文本的,可以用于在编译器中进行文本匹配和词法分析等操作。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

showswoller

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值