不存在语法二义性的检测算法,几乎是大家都接受了的一个命题,可我在网上用中文搜了一下也没看到这个命题的证明。。
证明某语法存在二义性,换个角度就是证明两个语法所描述的语言有交集。 而“语言有交集”我想不到什么算法可以搞,要是该语言的句子是有限的还好,直接暴力;但大部分语言都是无限的。。
一开始我觉得,从图论的角度应该是有检测二义性的算法存在的吧?点做token,边表联系,那随便遍历一下不就出来结果了么~ 后来一想,我们描述文法是用抽象语言去描述的,即使正则表达式也是抽象表达式,而我们目前的算法、编程语言都只能解决具体的食物。过程式语言就不说了,就算了函数式语言、逻辑式语言,也是只能描述“抽象”,而解决的是“具体”。
所以不论是lex/yacc,还是antlr这些语言工具,在生成代码时都没法判定某文法是否二义。有点像“你永远不会知道bug会在哪儿出现”的感觉。。
话说,求严谨证明。。
证明某语法存在二义性,换个角度就是证明两个语法所描述的语言有交集。 而“语言有交集”我想不到什么算法可以搞,要是该语言的句子是有限的还好,直接暴力;但大部分语言都是无限的。。
一开始我觉得,从图论的角度应该是有检测二义性的算法存在的吧?点做token,边表联系,那随便遍历一下不就出来结果了么~ 后来一想,我们描述文法是用抽象语言去描述的,即使正则表达式也是抽象表达式,而我们目前的算法、编程语言都只能解决具体的食物。过程式语言就不说了,就算了函数式语言、逻辑式语言,也是只能描述“抽象”,而解决的是“具体”。
所以不论是lex/yacc,还是antlr这些语言工具,在生成代码时都没法判定某文法是否二义。有点像“你永远不会知道bug会在哪儿出现”的感觉。。
话说,求严谨证明。。