因为 NFA 的状态转移不确定,不适合直接做词法分析器的识别,在写算法时往往需要使用回溯。所以我们一般使用子集构造算法,将 NFA 转换成 DFA, 得到确定的状态转移,再转化成一个词法分析器的代码。
下面给出一个关于 NFA 到 DFA 转化的例子,我们使用 a(b|c)* 做例:
对于 ε 的边表示一种零代价的转换,n1 可以在没有任何输入操作的情况下直接滑动到 n2,也就是 n1 和 n2 是等价的。
所以 n0 通过 a 可以走到 n1, n2, n3, n4, n6, n9。我们可以将这样的 6 个元素记为一个集合 q1。 q1 = {n1, n2, n3, n4, n6, n9} 。
q1 通过 b 可以得到:n5, n8, n9, n3, n4, n6 ,记为 q2。
q2 继续通过某一节点得到 q3,
继续重复该步骤,得到所有的子集。
所以 q0 通过 a 得到 q1, q1 通过 b 得到 q2 .... ,最终可以将 NFA 转化为一个 DFA。