编译原理——词法分析

最新推荐文章于 2024-09-14 06:32:57 发布

rdtyscxtkv

最新推荐文章于 2024-09-14 06:32:57 发布

阅读量194

点赞数

文章标签：正则表达式

本文链接：https://blog.csdn.net/jiangtuzhiren/article/details/128956532

版权

文章详细阐述了词法分析器的构造步骤，包括选择词法单元，定义正则表达式，转换为有限状态自动机，特别是非确定有限自动机（NFA）和确定有限自动机（DFA）之间的关系。提到了从正则表达式到DFA的转换，并介绍了Hopcroft算法用于DFA的最小化，以优化状态数量。

摘要由CSDN通过智能技术生成

词法分析

1.状态：当找到token时将状态画为接收状态，加*的接收状态表示最后读入的符号不纳入词素，即不属于此次构建token过程的单词。（一般都是跟在other后面的）
在这里插入图片描述

分为两类：非确定有限自动机（NFA），确定有限自动机（DFA）

NFA的转换表
DFA（确定有限自动机）：
1. DFA是特殊的NFA，没有空的转换，对于每个状态和输入符号a，有且仅有一条标号为a的离开该状态的边
2. 每一个NFA都有一个与之等价的DFA
3. 正则表达式=>NFA=>DFA
RE=>NFA(Thompson算法)
1. 总结就是归纳合并（多用空转换来换到不同的状态）
NFA=>DFA
1. 基本思想：
  1. 目标DFA的每个状态和NFA的状态子集对应（即合并前的各个状态）
  2. 目标DFA读入a1, a2, …, an后到达的状态对应于NFA从开始状态出发沿着a1, a2, …, an可能到达的所有状态的集合
  3. 如果其中包括多个对应于不同模式的NFA接受状态，则表示当前的输入前缀对应于多个模式，存在冲突。解决方式：找出第一个列出的这样的模式，将该模式作为此DFA接受状态的输出，即按序号在最前的排
2. 三个函数
  
  3. 算法：笔记上
3. Hopcorft算法：DFA的最小化，得到状态数量最少的DFA
  1. 如果存在串x，使得从状态s_1和s_2，一个到达接受状态而另一个到达非接受状态，那么x就区分了s_1和s_2
  2. hopcroft算法的基本思想就是根据每个集合中原DFA状态之间是否可区分将之分裂，直到每个集合都成为等价类为止（即集合间均不可区分），然后从每个等价类中选取一个代表，构造新的DFA
  3. 算法：
    细分的依据：