编译原理文法分类

最新推荐文章于 2024-07-05 22:37:42 发布

杨过姑父

最新推荐文章于 2024-07-05 22:37:42 发布

阅读量2.4k

点赞数 2

文章标签：算法

原文链接：https://www.jianshu.com/p/9bbf55f68544

版权

一. 文法公式

文法定义公式如下:

G = (VT , VN , P , S)

VT : 终结符集合

终结符就是不可以再推导的字符。
也就是说对于一个字符 a ,它属于终结符集合 VT(a∈VT) , a 不可以再推导的字符，即不能用其他字符表示 a。表现形式就是 a 不能单独出现在产生式左边。

VN : 非终结符集合

非终结符即可以继续推导的字符。

P : 产生式集合

产生式就是推导公式，表示这个文法的定义规则。
产生式形式 α→β ，其中 α 和 β 都是属于文法符合串 (VN∪VT)* 。α 称为产生式的左部或者头部；β 称为产生式的右部或者体。
文法符合串，即终结符集合和非终结符集合任一排列组合成的字符串。例如 aAbbB , 其中 (a,b∈VT , A,B∈VN) 就是一个文法符合串。

S : 开始符号

即文法从这个符号 S 利用产生集合 P 开始推导。S 是一个非终结符，即 S∈VN。
一般情况下，第一个产生式左部符号就是开始符号。

二. 文法分类

Chomsky 文法分类将文法分为四种，0型文法(PSG)、1型文法(CSG)、2型文法(CFG)和3型文法(RG)。

其实不同的文法就是对产生式进行逐层限制形成的。

2.1 0型文法(`PSG`)

又被称为无限制文法(Unrestricted Grammar), 或者短语结构文法（Phrase Structure Grammar）
定义: 对于产生式 α→β ，α 至少包含一个非终结符。

即 α,β∈(VN∪VT)* , α 和 β 都是文法符合串，并且 α 文法符合串中必须包含一个非终结符。
例如: aA→0bB; A0→11bB; 其中 (a,0,b∈VT),(A,B∈VN)。

为什么要叫无限制文法，明明它要求产生式的左部必须包含一个非终结符。

因为我们知道终结符是不能再推导出其他字符的，所以产生式的左部不能全是终结符组成的文法符合串(VT*)，这个是不允许的，所以产生式的左部必须包含一个非终结符。

2.2 1型文法(`CSG`)

又被称为上下文有关文法(Context-Sensitive Grammar)
定义：对于产生式 α→β , |α| <= |β|, 仅仅 S→ε 除外

|α| 表示 α 这个文法符合串中字符个数。例如 aAb 这个字符个数就是3个。

也就是说1型文法要求产生式右部文法符合串β 的字符个数要不小于产生式左部文法符合串α 的字符个数；但是空产生式(S→ε) 除外。

ε 表示空串，即文法符号串中没有任何字符元素(|ε|=0)

为什么叫做上下文有关文法？

因为对于任何一个非终结符 A (即 A∈VN)，想要将它替换成其他文法符号串，必须要有对应形式的产生式。

也可以这样理解，上下文有关文法没有规定产生式左边的符合串的长度，如果左边的符合串除了非终结符还有其他的字符（左边的符合串的长度大于1），这时我们要把非终结符前后的其他字符也要转换到右边，他们是需要一起进行转换的，当然非终结符前后的字符只是按照左边的相对位置原样移到了右边

一般情况下，这种产生式的形式为 α1Aα2→α1βα2