马上就要编译原理的考试了,看了看去年试卷,做几道题,发现自己对文法的概念都很模糊,下面整理了一下四种文法的基本概念:
那么什么是文法呢?乔姆斯基把文法分成四种类型,即0型、1型、2型和3型。这几类文法的差别在于对产生式施加不同的限制。多数程序设计语言的单词的语法都能用正规文法或3型文法来描述。3型文法G=(VN,VT,P,S)的P中的规则有两种形式:一种是前面定义的形式,即:A→aB或A→a其中A,B∈VN ,a∈VT*,另一种形式是:A→Ba或A→a,前者称为右线性文法,后者称为左线性文法。正规文法所描述的是VT*上的正规集。四个文法类的定义是逐渐增加限制的,因此每一种正规文法都是上下文无关的,每一种上下文无关文法都是上下文有关的,而每一种上下文有关文法都是0型文法。称0型文法产生的语言为0型语言。上下文有关文法、上下文无关文法和正规文法产生的语言分别称为上下文有关语言、上下文无关语言和正规语言。
从形式上文法是一个四元式(VN,VT,P,S)
VN为非终结符的集合 如:动词
VT为终结符的集合 如:动词->eat(eat不可分解,则为终结符)
P文法规则的集合
S开始符号
闭包的概念:
如果VN为{主语,谓语}
则VN的星闭包(就是普通闭包)为{空串,主语谓语谓语主语,主语谓语,谓语主语....}
VN里面各种各样的组合
正闭包则是除开空串的闭包。
小结:
上下文有关文法就是1型文法
上下文无关文法就是2型文法
正规文法就是3型文法
4类文法限制是逐渐增加的:
0型文法(短语文法或无限制文法),识别0语言的机器叫做图灵机
定义:P中产生式a-->b,其中a属于V正闭包且至少含有一个非终结符,b属于V星闭包
注:任何0型文法都是可递归可枚举的
对0型文法作某些限制,可以得到其他文法的定义
1型文法(上下文有关文法),线性界限自动机
增加的限制:除了S产生空串之外,产生式的右部长度要大于等于左部,S不能出现在右部,
非终结符不能产生空串。
例如:aAb-->ayb(在某种条件下A转换为y,所以称为上下文有关)
2型文法(上下文无关文法),下推自动机
增加的限制:P中只有A->b,而不是a->b,产生式左边只能有一个非终结符。
3型文法(正规文法),有限状态自动机
增加的限制:产生式的右边非终结符的位置要么在最左边要么在最右边而且最多只能有一个
在左端则称左线性文法,在右端则称右线性文法
对比:
四种文法之间的关系是随着型号的增加,对语言的限制条件就越来越大
条件如下:
0型文法 : 产生式左右两边都可以出现任意符号串
1型文法 : 产生式的左边可以有终结符的出现,产生式右边是任意符号串
2型文法 :产生式的左边是非终结符,产生式的右边是任意符号串
3型文法 :产生式的左边是非终结符,产生式的右边非终结符的位置要么在最左边要么在最右边而且最多只能有一个
如:A-->aB | d
A-->Ba | d