原文链接:https://zhuanlan.zhihu.com/p/39452141
由于我很想做个GraphQL的数据库前端, 最近开始复习编译原理, 课程是Udacity的公开课UD168.
很多人(笔者看了一些知乎回答后得出的结论)对于NFA转DFA的Subset Construction算法理解不是很透彻, 最后就只记住了一些名词而已.
先思考一个西方俗语, 称之为Duck Test,
When I see a bird that walks like a duck and swims like a duck and quacks like a duck, I call that bird a duck.
如果我看见一只鸟, 走路像鸭子, 游水像鸭子, 叫声像鸭子, 那么我认为这只鸟是鸭子.
Subset Construction的核心思路也是类似的, 而且我总结下来也就一句话,
如果状态B, C, D可以由同一(或多)个状态A加同一个transition得到, 那么状态B, C, D等价.
就是说NFA状态B, C, D这三只鸟, 可能在内存中的表达不同, 但它们的叫声都是状态A+同一个transition, 所以我认为它们都是鸭子, 可以把它们都折叠起来.
Subset Construction的完整过程就是沿着起始状态, 做一把BFS, 通过Duck Test不断把可以折叠的鸟合并成一只鸭子, 再从这些鸭子节点上继续做BFS, 直到所有的鸟都是鸭子.
所以为什么这个算法一定可以在有限时间内完成? 我也学到了一个新名词叫做不动点(Fixed-Point)运算. 因为假设NFA有n个状态, m种transition, 那么可以做的DFA折叠操作理论最大次数是n的组合*m+(n-1)的组合m...直至1*m, 次数有限, 自然不会停机.