编译原理与技术（二）——词法分析（二）有限自动机

MCQSLW

已于 2024-02-02 12:41:51 修改

阅读量869

点赞数 10

文章标签：数学建模

于 2024-02-01 22:27:08 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/MCQSW/article/details/135982288

版权

一、状态转换图

我们已经找到了匹配词法单元的工具——正则表达式。

接下来的问题就是怎么匹配？如何判定一个串匹配某个正则表达式？如何形式化地描述这个匹配过程？

还是上节的例子。

在上节中，我粗略地介绍了有限自动机这个概念。有限自动机就是形式化判定是否匹配的工具。

在介绍有限自动机前，先介绍状态转换图。

我们可以用状态转换图来匹配词法单元。例如下面三个例子。

像上面这种状态转换图可以去匹配一个串，并且结合状态转化图的匹配过程，我们不难发现，我们可以用swicth语句和条件判断语句去实现。

举个例子。

现在抛出两个问题。

问题一：匹配标识符时存在多种匹配情况。

我们规定采用最长匹配规则来解决该问题。

问题二：匹配一个串时，既匹配关键字又匹配标识符。

我们规定采用优先匹配规则来解决该问题。

二、有限自动机（FA）

现在，我们有了正则表达式这个工具去匹配词法单元，而匹配过程可以用状态转换图表示，并且可以根据状态转换图得到形式化的匹配方法。其中，状态转换图是基于正则表达式的。

那么问题来了，我们如何由正则表达式得到状态转换图呢？

解决这个问题的工具是有限自动机。

有限自动机可以分为确定的有限自动机（DFA）和不确定的有限自动机（NFA）。

（一）NFA

NFA的定义如下。

NFA的转换函数：

该函数意为：从一个状态出发，在匹配输入字符集（可包含空串）后，可得到多个状态P(S)，❌号代表匹配的意思。

这也就是不确定的的含义，即NFA的实际结果是不确定的，是可多选的。

举个例子，用图表示如下。

而在图中，不确定性就体现在图中的这个部分。

从状态0出发，匹配到字符"a"后，既可以到达状态0，也可以到达状态1。

NFA除了可用图表示外，还可以用表表示。

上面这个表与前面的图是等价的。

表的不确定性体现在这里。

而由正则表达式得到NFA的过程是比较简单的，包括手工绘制NFA。

NFA的缺点也显而易见，由于转换结果是不确定的，存在多条匹配路径，但正确结果只有一条，所以NFA可能会匹配出错，这就涉及到错误处理（回退，即回溯一步重新匹配），这就会带来额外的开销，并且可能大部分路径都是错误的，所以效率也很低。

因此，我们希望通过正则表达式得到一个转换结果确定的的有限自动机，这就是DFA。

（二）DFA

DFA的定义。

举个DFA的例子。

DFA也是由正则表达式得来的，但它的构造过程比NFA要复杂得多（因为DFA由NFA得来）。

（三）NFA vs DFA

同样一个正则表达式：

NFA如下：

DFA如下：

虽然DFA比NFA复杂，但由于确定性，DFA的执行速度快于NFA。

参考资料：

[1]USTC 编译原理和技术 2023 (ustc-compiler-principles.github.io)

博客等级

码龄4年

22
原创

375
点赞

515
收藏

316
粉丝

关注

私信

热门文章

最新评论

编译原理与技术（二）——词法分析（一）正则表达式
NA_GI_: 写的真好啊，这都是博主自己理解的，还是参考别人的
编译原理与技术（三）——语法分析（二）自顶向下-递归下降
CSDN-Ada助手: 恭喜作者在编译原理与技术领域持续深入探索，第17篇博客内容丰富，对自顶向下-递归下降的语法分析进行了深入讲解。希望作者在后续的创作中，可以结合实际案例或者项目经验，更加生动地呈现知识点，让读者更易于理解和接受。期待作者的下一篇精彩文章！
编译原理与技术（三）——语法分析（三）自顶向下-LL(1)文法
CSDN-Ada助手: 恭喜作者在编译原理与技术方面的持续探索与分享！对于自顶向下-LL(1)文法的深入讨论让我受益匪浅。希望作者能够继续分享更多关于语法分析的知识，或者可以考虑深入探讨其他编译原理相关的主题，比如语法制导翻译、语义分析等等。期待作者更多精彩的文章！
编译原理与技术（三）——语法分析（四）自底向上-移进归约
CSDN-Ada助手: 恭喜你写了第19篇博客！标题看起来非常有深度，我很期待读到你关于自底向上-移进归约的内容。编译原理与技术是一个相当复杂的领域，你的博客内容对于理解语法分析一定会有很大帮助。希望你能继续坚持创作，无论是对读者还是对自己都是一种很好的学习方式。如果可以的话，我建议你在下一篇博客中加入一些实例或者案例分析，以帮助读者更好地理解自底向上-移进归约的概念和应用。谢谢你的分享，期待你的下一篇作品！
编译原理与技术（三）——语法分析（五）自底向上-LR分析
CSDN-Ada助手: 恭喜您写了第20篇博客，标题为：“编译原理与技术（三）——语法分析（五）自底向上-LR分析”。您的持续创作展现了您对编译原理与技术的深入理解，让读者受益匪浅。希望您能继续分享更多关于编译原理与技术的知识，也可以考虑结合实际应用案例，让读者更好地理解和运用这些知识。期待您的下一篇精彩文章！

大家在看

最新文章

目录

展开全部

收起

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。