【形式语言与自动机】【《形式语言与自动机理论（第4版）》笔记】第二章：文法

「已注销」

于 2024-05-22 08:25:54 发布

阅读量768

点赞数 13

文章标签：形式语言与自动机

本文链接：https://blog.csdn.net/from__2024_04_11/article/details/139106752

版权

文章目录

@[toc]
2.1|启示
2.2|形式定义
文法
产生式

推导
语法范畴

文法产生的语言
句子
句型

2.3|文法的构造
文法的等价
文法的表示
文法的构造

2.4|文法的乔姆斯基体系
文法
$0$ 型文法
$1$ 型文法
$2$ 型文法
$3$ 型文法

$L$ 是 $R L$ 的充要条件
证明
充分性
必要性

线性文法
右线性文法
左线性文法
$L$ 是左线性语言的充要条件
定理
句子的分析过程

2.5|空语句
空产生式
定理
证明
证明 $L(G^{'}) \subseteq L(G)$
证明 $\subseteq L(G^{'})$

2.1|启示

2.2|形式定义

文法

文法 $G$ 是一个四元组： $G = (V, T, P, S)$
- $V$ ——变量的非空有穷集， $\forall A \in V$ ， $A$ 称为语法变量，简称变量，也称为非终极符号，它表示一个语法范畴，记作 $L (A)$
- $T$ ——终极符的非空有穷集， $\forall a \in T$ ， $a$ 称为终极符，由于 $V$ 中符号表示语法范畴， $T$ 中的符号是语言的句子中出现的字符，所以有 $\cap T = \emptyset$
- $P$ ——产生式的非空有穷集合， $P$ 中的元素均具有形式 $\alpha \rightarrow \beta$ ，称为产生式，读作 $\alpha$ 定义为 $\beta$ ，其中 $\alpha \in (V \cup T)^{+}$ ，且 $\alpha$ 中至少有 $V$ 中的一个元素出现， $\beta \in (V \cup T)^{*}$ ， $\alpha$ 称为产生式 $\alpha \rightarrow \beta$ 的左部， $\beta$ 称为产生式 $\alpha \rightarrow \beta$ 的右部，产生式又称为定义式或者语法规则
- $S$ —— $\in V$ ，文法 $G$ 的开始符号

产生式

对一组有相同左部的产生式： $\alpha \rightarrow \beta_{1}$ ， $\alpha \rightarrow \beta_{2}$ ， $\cdots$ ， $\alpha \rightarrow \beta_{n}$ 可以简单地记为 $\alpha \rightarrow \beta_{1} \mid \beta_{2} \mid \cdots \mid \beta_{n}$ ，其中 $\beta_{1}$ ， $\beta_{2}$ ， $\cdots$ ， $\beta_{n}$ 称为候选式
文法中所有定义 $\alpha$ 的产生式为 $\alpha$ 产生式

推导

设 $G = (V, T, P, S)$ 是一个文法，如果 $\alpha \rightarrow \beta \in P$ ， $\gamma$ ， $\delta \in (V \cup T)^{*}$ ，则称 $\gamma \alpha \delta$ 在 $G$ 中直接推导出 $\gamma \beta \delta$ ，记作 $\gamma \alpha \delta \xRightarrow[G]{} \gamma \beta \delta$ ，读作 $\gamma \alpha \beta$ 在文法 $G$ 中直接推导出 $\gamma \beta \delta$ ，称 $\gamma \beta \delta$ 在文法 $G$ 中直接归约成 $\gamma \alpha \delta$
推导也称为派生
$\xRightarrow[G]{}$ 是 $\cup T)^{*}$ 上的二元关系，用 $\xRightarrow[G]{+}$ 代表 $(\xRightarrow[G]{})^{+}$ ，用 $\xRightarrow[G]{*}$ 代表 $(\xRightarrow[G]{})^{*}$ ，用 $\xRightarrow[G]{n}$ 代表 $(\xRightarrow[G]{})^{n}$
- $\alpha \xRightarrow[G]{n} \beta$ 表示 $\alpha$ 在 $G$ 中经过 $n$ 步推导出 $\beta$ ， $\beta$ 在 $G$ 中经过 $n$ 步归约于 $\alpha$ ，即存在 $\alpha_{1}$ ， $\alpha_{2}$ ， $\cdots$ ， $\alpha_{n - 1} \in (V \cup T)^{*}$ ，使得 $\alpha \xRightarrow[G]{} \alpha_{1}$ ， $\alpha_{1} \xRightarrow[G]{} \alpha_{2}$ ， $\cdots$ ， $\alpha_{n - 1} \xRightarrow[G]{} \beta$
- 当 $n = 0$ 时，有 $\alpha = \beta$ ，即 $\alpha \xRightarrow[G]{0} \beta$

语法范畴

设 $(\set{S , A , B} , \set{0 , 1} , \set{S \rightarrow A \mid AB , A \rightarrow 0 \mid 0A , B \rightarrow 1 \mid 11} , S)$ ，则有如下一些推导
- 对于 $\geq 1$ ， $\xRightarrow{n} 0^{n}$ ， $\xRightarrow{n} 0^{n} A$
- $\Rightarrow 1$ ， $\Rightarrow 11$
- 语法范畴 $A$ 代表的集合 $L (A)$ 为 $\set{0 , 00 , 000 , \cdots} = \set{0^{n} \mid n \geq 1}$
- 语法范畴 $B$ 代表的集合 $L (B)$ 为 $\set{1 , 11}$
- 语法范畴 $S$ 代表的集合为 $\cup L(A) L(B) = \set{0 , 00 , 000 , \cdots} \cup \set{0 , 00 , 000 , \cdots} \set{1 , 11} = \set{0 , 00 , 000 , \cdots} \cup \set{01 , 001 , 0001 , \cdots} \cup \set{011 , 0011 , 00011 , \cdots}$

文法产生的语言

设文法 $G = (V, T, P, S)$ ，则称 $\set{w \mid w \in T^{*} 且 S \xRightarrow{*} w}$ 为文法 $G$ 产生的语言
对于任意一个文法 $G$ ， $G$ 产生的语言 $L (G)$ 就是该文法的开始符号 $S$ 对应的语法范畴 $L (S)$

句子

$\forall w \in L(G)$ ， $w$ 称为 $G$ 的一个句子

句型

设文法 $G = (V, T, P, S)$ ，对于 $\forall \alpha \in (V \cup T)^{*}$ ，如果 $\xRightarrow{*} \alpha$ ，则称 $\alpha$ 是 $G$ 产生的一个句型

2.3|文法的构造

文法的等价

设有两个文法 $G_{1}$ 和 $G_{2}$ ，如果 $L(G_{1}) = L(G_{2})$ ，则称 $G_{1}$ 与 $G_{2}$ 等价

文法的表示

如果约定所列的第一个产生式的左部就是该文法的开始符号，则对于一个文法，只用列出它的所有产生式

文法的构造

构造文法 $G$ ，使得 $\set{\omega \mid \omega \in \set{0 , 1}^{+}}$
- $\rightarrow 0 \mid 1 \mid 0S \mid 1S$
构造文法 $G$ ，使得 $\set{\omega \omega^{T} \mid \omega \in \set{0 , 1 , 2 , 3}^{+}}$
- $\rightarrow 00 \mid 11 \mid 22 \mid 33 \mid 0S0 \mid 1S1 \mid 2S2 \mid 3S3$
构造文法 $G$ ，使得 $\set{a^{n} b^{n} c^{n} \mid n \geq 1}$

$\rightarrow aBC \mid aSBC \\ CB \rightarrow BC \\ aB \rightarrow ab \\ bB \rightarrow bb \\ bC \rightarrow bc \\ cC \rightarrow cc$

$\rightarrow abc \mid aSBc \\ bB \rightarrow bb \\ cB \rightarrow Bc$

2.4|文法的乔姆斯基体系

文法

$0$ 型文法

设文法 $G = (V, T, P, S)$ ，则 $G$ 叫做 $0$ 型文法或短语结构文法， $L (G)$ 叫做 $0$ 型语言、短语结构语言（ $PS L$ ）或递归可枚举集

$1$ 型文法

设文法 $G = (V, T, P, S)$ ，如果对于 $\forall \alpha \rightarrow \beta \in P$ ，均有 $|\beta| \geq |\alpha|$ 成立，则称 $G$ 为 $1$ 型文法或上下文有关文法， $L (G)$ 叫做 $1$ 型语言或上下文有关语言（ $CS L$ ）

$2$ 型文法

设文法 $G = (V, T, P, S)$ ，如果对于 $\forall \alpha \rightarrow \beta \in P$ ，均有 $|\beta| \geq |\alpha|$ ，并且 $\alpha \in V$ 成立，则称 $G$ 为 $2$ 型文法或上下文无关文法， $L (G)$ 叫做 $2$ 型语言或上下文无关语言（ $CF L$ ）

$3$ 型文法

设文法 $G = (V, T, P, S)$ ，如果对于 $\forall \alpha \rightarrow \beta \in P$ ， $\alpha \rightarrow \beta$ 均具有形式 $\rightarrow w$ 或 $\rightarrow wB$ ， $A$ ， $\in V$ ， $\in T^{+}$ ，则称 $G$ 为 $3$ 型文法、正则文法或正规文法， $L (G)$ 叫做 $3$ 型语言、正则语言或正规语言（ $R L$ ）

$L$ 是 $R L$ 的充要条件

$L$ 是 $R L$ 的充要条件是存在一个文法，该文法产生语言 $L$ ，并且它的产生式要么是形如 $\rightarrow a$ 的产生式，要么是形如 $\rightarrow aB$ 的产生式，其中 $A$ 和 $B$ 为语法变量， $a$ 为终极符号

证明

充分性

设有 $G^{'}$ ， $L(G^{'}) = L$ ，且 $G^{'}$ 的产生式形式满足定理要求，这种文法是 $RG$ ，所以， $G^{'}$ 产生的语言是 $R L$

必要性

构造文法 $G^{'}$
- 设 $L$ 是 $R L$ ，存在有 $\ G$ ，该文法产生 $L$ ，设 $G = (V, T, P, S)$ ， $P$ 中的产生式要么是形如 $\rightarrow w$ 的，要么是形如 $\rightarrow wB$ 的，设 $a_{1} a_{2} \cdots a_{n} , n \geq 1$
- 对于 $P$ 中的每一个产生式，如果该产生式形如 $\rightarrow a_{1} a_{2} \cdots a_{n}$ ，则将 $\rightarrow a_{1} A_{1}$ ， $A_{1} \rightarrow a_{2} A_{2}$ ， $\cdots$ ， $A_{n - 1} \rightarrow a_{n}$ 放入产生式集 $P^{'}$
- 如果该产生式形如 $\rightarrow a_{1} a_{2} \cdots a_{n} B$ ，则将 $\rightarrow a_{1} A_{1}$ ， $A_{1} \rightarrow a_{2} A_{2}$ ， $\cdots$ ， $A_{n - 1} \rightarrow a_{n} B$ 放入产生式集 $P^{'}$
- 令 $V^{'}$ 是由 $P^{'}$ 中所有产生式中的语法变量构成的集合， $G^{'} = (V^{'} , T , P^{'} , S)$
证明 $L(G^{'}) = L(G)$
- 需证明 $\forall x \in T^{*} , x \in L(G^{'}) \Leftrightarrow x \in L(G)$
- 首先证明如果 $\xRightarrow[G]{n} x$ ，则 $\xRightarrow[G^{'}]{m} x$
  - 当 $n = 1$ 时，必有 $\rightarrow x \in P$ ，设 $a_{1} a_{2} \cdots a_{h}$ ，在 $P^{'}$ 中有 $\xRightarrow[G^{'}]{} a_{1} A_{1} \xRightarrow[G^{'}]{} a_{1} a_{2} A_{2} \xRightarrow[G^{'}]{} \cdots \xRightarrow[G^{'}]{} a_{1} a_{2} \cdots a_{h}$
  - 所以， $n = 1$ 时结论成立
  - 设 $n = k$ 时结论成立，往证 $n = k + 1$ 时结论成立
  - 设 $n = k + 1$ ， $x = x_{1} x_{2}$ ，有 $\xRightarrow[G]{} x_{1} B \xRightarrow[G]{k} x_{1} x_{2}$ ， $\xRightarrow[G]{k} x_{2}$ ，设 $x_{1} = a_{1} a_{2} \cdots a_{h}$ ，则 $\rightarrow a_{1} a_{2} \cdots a_{h} B \in P$
  - 在 $P^{'}$ 中有 $\xRightarrow[G^{'}]{} a_{1} A_{1} \xRightarrow[G^{'}]{} a_{1} a_{2} A_{2} \xRightarrow[G^{'}]{} \cdots \xRightarrow[G^{'}]{} a_{1} a_{2} \cdots a_{h} B$ ，由归纳假设，存在 $m$ ，使得 $\xRightarrow[G^{'}]{m} x_{2}$ ，所以 $\xRightarrow[G^{'}]{} a_{1} A_{1} \xRightarrow[G^{'}]{} a_{1} a_{2} A_{2} \xRightarrow[G^{'}]{} \cdots \xRightarrow[G^{'}]{} a_{1} a_{2} \cdots a_{h} B \xRightarrow[G^{'}]{m} a_{1} a_{2} \cdots a_{h} x_{2}$
  - 由归纳法原理，结论对 $\forall A \in V$ 成立
- 再证明，如果 $\xRightarrow[G^{'}]{n} x$ ，则 $\xRightarrow[G]{m} x$
  - 当 $n = 1$ 时，必有 $\rightarrow x \in P^{'}$ ，必有 $\rightarrow x \in P$ ，所以 $\xRightarrow[G]{} x$ ，即结论对 $n = 1$ 成立
  - 假设结论对 $n < k$ 成立
  - 当 $\geq 2)$ 时，必有 $\xRightarrow[G^{'}]{} a_{1} A_{1} \xRightarrow[G^{'}]{} a_{1} a_{2} A_{2} \xRightarrow[G^{'}]{} \cdots \xRightarrow[G^{'}]{} a_{1} a_{2} \cdots a_{h}$ 或 $\xRightarrow[G^{'}]{} a_{1} A_{1} \xRightarrow[G^{'}]{} a_{1} a_{2} A_{2} \xRightarrow[G^{'}]{} \cdots \xRightarrow[G^{'}]{} a_{1} a_{2} \cdots a_{h} B \xRightarrow[G^{'}]{m} a_{1} a_{2} \cdots a_{h} x_{2}$
    - 当第一种情况出现时， $a_{1} a_{2} \cdots a_{h}$ ，有 $\rightarrow a_{1} a_{2} \cdots a_{h} \in P$ ，所以 $\xRightarrow[G]{} a_{1} a_{2} \cdots a_{h}$
    - 当第二种情况出现时， $a_{1} a_{2} \cdots a_{h} x_{2}$ ，必有 $\rightarrow a_{1} a_{2} \cdots a_{h} B \in P$ ， $\xRightarrow[G]{} a_{1} a_{2} \cdots a_{h} B$ ，且 $B$ 在 $G^{'}$ 中用不足 $k$ 步推导出 $x_{2}$ ，由归纳假设，存在 $m$ ， $B$ 在 $G$ 中经过 $m$ 步推导出 $x_{2}$ ，从而 $\xRightarrow[G]{} a_{1} a_{2} \cdots a_{h} B \xRightarrow[G]{m} a_{1} a_{2} \cdots a_{h} x_{2}$
    - 所以，无论是第一种情况还是第二种情况，对 $n = k$ 结论都成立
  - 由归纳法原理，结论对 $\forall A \in V$ 成立

线性文法

设 $G = (V, T, P, S)$ ，如果对于 $\forall \alpha \rightarrow \beta \in P$ ， $\alpha \rightarrow \beta$ 均具有 $\rightarrow x$ 或 $\rightarrow wBx$ 形式，其中， $A$ ， $\in V$ ， $w$ ， $\in T^{*}$ ，则称 $G$ 为线性文法， $L (G)$ 称为线性语言

右线性文法

设 $G = (V, T, P, S)$ ，如果对于 $\forall \alpha \rightarrow \beta \in P$ ， $\alpha \rightarrow \beta$ 均具有 $\rightarrow x$ 或 $\rightarrow wB$ 形式，其中， $A$ ， $\in V$ ， $\in T^{+}$ ，则称 $G$ 为右线性文法， $L (G)$ 称为右线性语言

左线性文法

设 $G = (V, T, P, S)$ ，如果对于 $\forall \alpha \rightarrow \beta \in P$ ， $\alpha \rightarrow \beta$ 均具有 $\rightarrow x$ 或 $\rightarrow Bw$ 形式，其中， $A$ ， $\in V$ ， $\in T^{+}$ ，则称 $G$ 为左线性文法， $L (G)$ 称为左线性语言

$L$ 是左线性语言的充要条件

$L$ 是左线性语言的充要条件是存在文法 $G$ ， $G$ 中的产生式要么是形如 $\rightarrow a$ 的产生式，要么是形如 $\rightarrow Ba$ 的产生式，且 $L (G) = L$ ，其中 $A$ ， $B$ 为语法变量， $a$ 为终极符号

定理

左线性文法与右线性文法等价

句子的分析过程

在句子的分析过程中，右线性文法对应于句子的推导过程，左线性文法对应于句子的归约过程

2.5|空语句

空产生式

形如 $\rightarrow \varepsilon$ 的产生式称为空产生式，也可称为 $\varepsilon$ 产生式

定理

设 $G = (V, T, P, S)$ 为一文法，则存在与 $G$ 同类型的文法 $G^{'} = (V^{'} , T , P^{'} , S^{'})$ ，使得 $L(G) = L(G^{'})$ ，但 $G^{'}$ 的开始符号 $S^{'}$ 不出现在 $G^{'}$ 的任何产生式的右部

证明

当文法 $G = (V, T, P, S)$ 的开始符号 $S$ 不出现在 $P$ 中任何产生式的右部时， $G$ 就是所求
否则，取 $S^{'} \notin V$ ， $G^{'} = (V \cup \set{S^{'}} , T , P^{'} , S^{'})$ ， $P^{'} = P \cup \set{S^{'} \rightarrow \alpha \mid S \rightarrow \alpha \in P}$ ，显然 $G^{'}$ 与 $G$ 有相同的类型

证明 $L(G^{'}) \subseteq L(G)$

对任意 $\in L(G^{'})$ ，在 $G^{'}$ 中存在推导 $S^{'} \Rightarrow \alpha \xRightarrow{*} x$
由 $P^{'}$ 的定义，有 $\rightarrow \alpha \in P$ ，所以 $\Rightarrow \alpha \xRightarrow{*} x$ ，故 $\in L(G)$

证明 $\subseteq L(G^{'})$

对任意 $\in L(G)$ ，在 $G$ 中存在推导 $\Rightarrow \alpha \xRightarrow{*} x$
$P^{'} = P \cup \set{S^{'} \rightarrow \alpha \mid S \rightarrow \alpha \in P}$ ，在 $G^{'}$ 中 $S^{'} \Rightarrow \alpha \xRightarrow{*} x$ ，故 $\in L(G^{'})$