1. 重点内容
词法分析这一章最主要的内容是正规式和自动机,概念主要包括正规式、正规集、确定的有限自动机、非确定的有限自动机、等价,主要的可操作内容有正规式和自动机的转化、自动机的确定化、自动机的简化,这里面需要状态转化图、状态矩阵、子集闭包来做中间工作。
首先对正规式和正规集的了解是学习自动机的基础:
1、正规集:具有相同特征的字放在一起组成一的集合(该类单词的全集)。
2、 正规式:表示正规集的一种形式化的方法(描述单词结构的一种形式)。
确定的有限自动机(DFA Deterministic Finite Automata)和非确定的有限自动机(NFA Non-deterministic Finite Automata)在定义上有很明确的区分,NFA代表的是一个有限自动机的集合,指的是一类,而DFA可以说是NFA的一个特殊情况,是NFA这个集合中的某一个元素。
1、 DFA定义:一个确定有限自动机(DFA)M是一个五元式:
M = (S, ∑, f, s0, F),其中
a. S是一个有限的状态集合,它的每个元素我们称为一个状态
b. ∑是一个有穷的输入符号的字母表,它的每个元素我们称为一个输入字符
c. f是从 S×∑ →S的单值部分映射
d. s0是S的一个元素,为初始状态,它是唯一的
e. 状态集合F是终止状态的集合,它是S的子集(可空)
2、 DFA M的表示方法
1) 状态转换矩阵表示法
2) 状态转换图
3、NFA定义:一个非确定有限自动机(NFA)M是一个五元式M = (S, ∑, f, S0, F),其中
a. S是一个有限的状态集合,它的每个元素我们称为一个状态
b. ∑是一个有限的输入符号的字母表,它的每个元素我们称为一个输入字符
c. f