编译原理实验：正则表达式-＞NFA-＞DFA-＞最小化DFA图并生成词法分析程序

June_gjy

已于 2023-10-31 12:52:32 修改

阅读量1k

点赞数 8

分类专栏：编译原理文章标签：正则表达式 c++

于 2023-10-26 21:58:46 首次发布

本文链接：https://blog.csdn.net/weixin_50549897/article/details/134065599

版权

1 篇文章 0 订阅

订阅专栏

本文介绍了华南师范大学编译原理实验中的XLEX项目，详细阐述了如何从正则表达式生成NFA、DFA并进行最小化，以及如何用C++实现词法分析程序。实验涉及双栈法、NFA转DFA、DFA简化等技术，还展示了界面操作流程。

摘要由CSDN通过智能技术生成

本实验为华南师范大学编译原理实验二
作者：关竣佑
编译环境 Qt 4.3.0
代码仓库：https://github.com/guanjunyou/LexicalAnalysisGenerator
实现将正则表达式–>NFA—>DFA–>DFA最小化–>词法分析程序

输入正则表达式可换行，换行默认在两行间加选择（|）

可保存正则表达式（默认保存为 regex.txt 在 release 目录下）

可选择任意正则表达式文件（TXT格式) 载入为正则表达式输入

读入正则表达式，使用双栈法生成 NFA 图。类似于算术表达式的计算，一个栈存储正则表达式的运算符，另一个栈存储图的结构。

另外，为了方便后续的操作，还要存储每个NFA结点针对 # 边的出度和入度（不是所有的出度和入读都计入！）
NFA转DFA图： 对每个 # 入度为0的边开始 DFS ，知道遍历到边缘点，把所有遍历到的NFA点合成为一个DFA结点，因为经历了上面的合并操作后，会出现一个DFA点有两条相同字母的出边分别连向不同的DFA点的情况，然而这是不允许的（因为路径将是不确定的），所以接着要将两条相同字母边指向的 DFA点合并为一个DFA点。
DFA图化简： 首先将DFA结点划分为终态和非终态两个大的新DFA结点。放入队列中。对于每个正则表达式运算符，“过滤”一遍队列，队头弹出一个DFA点，针对该运算符求出分裂后的新的DFA点（如果对于这个运算符的边到达了不同的之前的DFA点则分裂为两个），将分裂后的DFA结点插入队尾。（可参考二叉树层序遍历的思路，逐层操作）