二、词法分析

从左到右扫描,产生一个个单词符号。词法分析一般作为语法分析的子程序。

单词符号的分类

  • 保留字:比如C语言中的if,else等
  • 标识符:用于标记常量、数组、类型、变量等
  • 常数
  • 运算符:+、-、*、/、<、>等
  • 界符(分隔符):分号,逗号等

一般用二元式作为输出单词的形式:
(单词种别,单词自身的值)
单词种别一般是一个整数码。

正规表达式与正规集

以一个例子来说明正规表达式:
标识符的定义是以字母开头的字母数字串,那么就可以表示为 letter(letter | digit)*
这就是标识符的正规表达式,简称正规式。
正规集就是用正规表达式所能生成的所有组合,设 R 为一个正规式,则 L( R ) 表示 R 的正规集。

有限自动机

如果学过AC自动机或者是字典树的话,会帮助理解有限自动机,因为二者的实现原理是类似的。
有限自动机分为确定有限自动机(DFA)和非确定有限自动机(NFA)
DFA和NFA的主要区别有两点:
1.DFA只有一个初始状态,而NFA可以有若干个初始状态
2.NFA的状态转换函数f不是单值函数,也就是说可以从一个结点通过相同的字符跳转到多个结点。
相同点:都可以用五元组来表示

DFA

表示方法为Md = (S,Σ,f,s0,Z)
S:有限状态集,每个元素为一个状态,罗列了所有会出现的字符
Σ:有穷输入字母表,每一个元素称为一个输入字符,跳转边上的字符从Σ中取
f:一个从 SxΣ 到 S 的单值映射,也就是跳转关系
s0∈S:唯一的初始状态
Z⊂S:一个终态集

NFA

表示方法为Mn = (S,Σ,f,Q,Z)
与DFA不同的部分:
f:一个从 SxΣ* 到 S 的子集映射,SxΣ*表示可以通过空值进行跳转
Q⊂S:非空初态集

下面是DFA和NFA的转换图画法示例
在这里插入图片描述

由正规表达式到有限自动机的构造★

构造非确定有限自动机

第一步:画出如图所示的拓广转换图
在这里插入图片描述
第二步:运用如下三条转换规则对拓广图进行扩展
在这里插入图片描述
书上的一个例子2.6:
在这里插入图片描述

NFA的确定化

每个NFA都能相应地构造出一个与之等价的DFA
我们采用子集法对其进行确定化,也就是将多个状态合并为DFA中的一个状态。
首先介绍一下ε_CLOSURE(I) ,这个表示从状态I经过若干条ε边所能到达的所有状态以及状态I自身的集合
那么同理 a_CLOSURE(I) 表示从状态I经过一条a边和若干条ε边所能到达的所有状态以及状态I自身的集合。可以简化为 Ia 表示。
在这里插入图片描述
书上的一个例子2.8:
在这里插入图片描述
对例2.6进行确定化:
在这里插入图片描述

在这里插入图片描述
由于画图比较复杂,略。

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值