dfa2.java 原理_设计有穷自动机DFA实现C++简单程序的词法分析、扫描(编译原理实验)...

本文介绍了使用有限自动机DFA进行C++源程序的词法分析,探讨了实验要求,包括对头文件处理的修改以及如何处理二义性问题。文章详细阐述了DFA设计,展示了一段Java实现代码,并提供了实验结果输出和Vim编辑器中的代码截图。
摘要由CSDN通过智能技术生成

前面两篇(一、二)只是直观地针对已明确给出的教学语言 Tiny 源程序进行直接的词法分析(其实根本就称不上),不具有一般性(下面这个针对C++源程序的词法分析也相当单一,考虑面不足)。下面是我们的课程实验,需要结合课堂上学到的利用有限自动机DFA的方法来设计并分析源程序,提取出符合要求的Token。

根据老师给出的课件以及教材上的内容,扫描程序(词法分析)有下面3种实现方式,前面两篇(一、二)就是属于“直接编写”这一类,而本文则是“DFA”这一类。

d6df394e1e9762a91446ad1608f7276f.png

1、按实验要求(如下),目前只拙劣地实现了第(1)和(5)点。

ae6721048195d1aac8f00c3b8d14911b.png

而且第(1)点中有两个要求未能完成:

★ 浮点数,因为包含单行、多行注释的DFA已经很混乱了,这部分暂时先不实现,考虑将来用“表驱动法”(即状态转换表)来实现。

★ 注释,与教材类似不打印单行和多行注释,因此代码实现中少了处理注释的内容。

实验中用到的C++源程序与要求如下图:

53831c092cdb071685f164bbb6fd84cb.png

2、对实验要求中的“样例程序”稍微修改了一下。

★ 头文件#include 被改为 #include "iostream.h",即 iostream.h 是由双引号 "" 而不是尖括号 < > 包围的,实际上回到了 C 的代码规范。这样修改是因为原本确定 DFA 时考虑不全面,忽略了“小于等于 <=,大于等于 >=,判断 ==,不等于 != ”这几种特殊情况,因为他们会跟 < > = ! 这几个特殊字符造成二义性。

★ 同时,C++ 中的 IO 有“ >> 与 << ”也可能与上述特殊字符造成歧义,这个使得实现代码中的 unGetNextChar(int step) 与教材中的有所不同,因为该函数带了一个“步长参数 step”,其实也是为了迁就 #include<iostream.h> 中的 > 与代码中的 >> 和 >=。

其实,"iostream.h"也被作为字符串识别了,目前尚改进不了。

★ 另外为了测试算术运算符,对实验要求中的样例程序进行了修改,程序按照该样例作为输入,如下图加上了一个“i = i + 2;”语句:

4e769a81b7d8bd09db89738a1a0ee4c8.png

3、程序中的打印输出模仿了教材中的样例输出。

★ 对于以上样例输入,最终程序输出结果如下:

282171deb9bfeefe2795f40188779d5b.png

4、针对该C++源程序设计的DFA 图大致如下:

05a6bf60f590b25e9e8439f5681174e9.png

5、实现代码(Java)

近来喜欢上了Vim的代码高亮,看着清晰明朗,下面是整个实现代码在Vim下的截图,文本代码在本文最后:

81b52ee8bf3898065bef2764f10dcaab.png

1. 实验内容 每一个正规集都可以由一个状态数最少的DFA所识别,这个DFA是唯一的(不考虑同构的情况)。任意给定的一个DFA,根据以下算法设计一个C程序,将该DFA 化简为与之等价的最简DFA。 2. 实验设计分析 2.1 实验设计思路 根据实验指导书和书本上的相关知识,实现算法。 2.2 实验算法 (1)构造具有两个组的状态集合的初始划分I:接受状态组 F 和非接受状态组 Non-F。 (2)对I采用下面所述的过程来构造新的划分I-new. For I 中每个组G do Begin 当且仅当对任意输入符号a,状态s和读入a后转换到I的同一组中; /*最坏情况下,一个状态就可能成为一个组*/ 用所有新形成的小组集代替I-new中的G; end (3)如果I-new=I,令I-final=I,再执行第(4)步,否则令I=I=new,重复步骤(2)。 (4)在划分I-final的每个状态组中选一个状态作为该组的代表。这些代表构成了化简后的DFA M'状态。令s是一个代表状态,而且假设:在DFA M中,输入为a时有从s到t转换。令t所在组的代表是r,那么在M’中有一个从s到r的转换,标记为a。令包含s0的状态组的代表是M’的开始状态,并令M’的接受状态是那些属于F的状态所在组的代表。注意,I-final的每个组或者仅含F中的状态,或者不含F中的状态。 (5)如果M’含有死状态(即一个对所有输入符号都有刀自身的转换的非接受状态d),则从M’中去掉它;删除从开始状态不可到达的状态;取消从任何其他状态到死状态的转换。 。。。。。。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值