语法分析笔记（一）

最新推荐文章于 2024-06-20 10:38:28 发布

leukocyten

最新推荐文章于 2024-06-20 10:38:28 发布

阅读量1.5k

点赞数

分类专栏：编译原理

本文链接：https://blog.csdn.net/qq_43707223/article/details/105436061

版权

编译原理专栏收录该内容

6 篇文章 0 订阅

订阅专栏

语法分析笔记

语法分析笔记（一）

语法分析笔记（三）——LR分析法

语法分析笔记（四）——LR(0) SLR LR(1) LALR

语法分析

语法分析：语法分析器从词法分析器输出的token序列中识别出各类短语，并构造语法分析树的过程。
而语法分析树则描述了语法的分析结构。
即分析句子的格式，并找到句子中各自对应的成分，例如：

输入串	格式（文法）	句子类型	各自对应成分
a=2;	<变量名> = <值> ;	赋值语句	<变量名>:a =:= <值>:2 ;:;
intf(inta,intb);	<返回值类型><函数名>(<参数类型><参数名>,<参数类型><参数名>);	函数声明语句	<返回值类型>:int <函数名>:f (: ( <参数类型>:int <参数名>:a ,:, <参数类型>:int <参数名>:b ): ) ;:;

不同语言对应的语法格式不同

文法

G = ( V $_T$ ，V $_N$ ，P，S )

V $_T$ ：终极符集合（终极符是文法所定义的语言的基本符号，不可再分，也称token）
V $_N$ ：非终极符集合（非终极符用来表示语法成分，也称语法变量）
P：产生式集合（产生式描述将终极符和非终极符组合成串的方法）
产生式形式： $\alpha\rightarrow\beta$ ，读作 $\alpha$ 定义为 $\beta$
$\alpha$ $\in$ ( V $_T$ $\cup$ V $_N$ ) $\ ^+$ ，且 $\alpha$ 中至少包含V $_N$ 中的一个元素：称为产生式的头或左部
$\beta$ $\in$ ( V $_T$ $\cup$ V $_N$ ) $\ ^+$ ，称为产生式的体或右部
S $\in$ V $_N$ ，开始符号表示的是该文法中最大的语法成分，表示最终的描述对象

推导

给定文法 G = ( V $_T$ ，V $_N$ ，P，S )，如果 $\alpha$ $\rightarrow$ $\beta$ $\in$ P，那么可以将符号串 $\gamma\alpha\delta$ 中的 $\alpha$ 替换为 $\beta$ ，也就是说，将 $\gamma\alpha\delta$ 重写为 $\gamma\beta\delta$ ，记作 $\gamma\alpha\delta$ $\Rightarrow$ $\gamma\beta\delta$ 。此时，称文法中的符号串 $\gamma\alpha\delta$ 直接推导出 $\gamma\beta\delta$ ，即用产生式的右部替换产生式的左部。

最左推导

最左推导：总是选择每个句型的最左非终极符进行替换。
从文法的开始符经过最左推导得到的句型称为最左句型。

最右推导

最右推导：总是选择每个句型的最右非终极符进行替换。
从文法的开始符经过最右推导得到的句型称为最右句型。
最右推导称为规范推导，其逆过程最左规约称为规范规约。
最左推导和最右推导具有唯一性。

规约

规约是推导的逆过程。
每次规约的符号串称为句柄。
句柄是句型的最左直接短语。

句型和句子

如果 S $\Rightarrow^*\alpha$ ， $\alpha$ $\in$ ( V $_T$ $\cup$ V $_N$ ) $\ ^*$ ，则称 $\alpha$ 是 G 的一个句型。
如果 S $\Rightarrow^*\omega$ ， $\omega$ $\in$ V $_T$ $\ ^*$ ，则称 $\alpha$ 是 G 的一个句子。
句子是不包含非终极符的句型。

文法分类

在这里插入图片描述

文法分析树（上下文无关文法）

在这里插入图片描述

短语

在这里插入图片描述

二义性文法及判定

在这里插入图片描述

自顶向下的分析方法

自顶向下的分析方法可从这两方面来理解：

从分析树的顶部（根节点）向底部（叶节点）方向构造语法分析树
从文法开始符号 S 推导出词串 $\omega$ 的过程

自顶向下的语法分析方法采用最左推导方式

自底向上的分析方法

自底向上的分析方法可从这两方面来理解：

从分析树的底部（叶节点）向顶部（根节点）方向构造语法分析树
将输入串 $\omega$ 规约为文法开始符号 S 的过程

自底向上的语法分析方法采用最左规约方式（反向构造最右推导）
自底向上语法分析的通用框架：移入——规约分析
移入——规约分析的工作过程：

在对输入串的一次从左到右扫描过程中，语法分析器将零个或多个输入符号移入到栈的顶端，直到它可以对栈顶的一个文法符号串 $\beta$ 进行规约为止
将 $\beta$ 规约为某个产生式的左部
语法分析器不断重复这个循环，直到它检测到一个语法错误，或者栈中包含了开始符号且输入缓冲区为空为止（即成功完成语法分析）

在这里插入图片描述
但是移入——规约分析过程也存在问题
当站内符号串末尾可同时按照不同产生式进行规约时，选择哪个产生式规约将决定最终分析的成败。
分析失败的例子：

分析成功的例子：

成功分析应是每次规约均为当前句柄，因而能否成功识别出句柄将决定分析的成败。
由于移入——规约分析存在以上的问题，为了解决以上问题，提出了LR分析法
LR分析法: 语法分析笔记（三）——LR分析法

计算机如何实现自顶向下分析？

计算机采用递归下降分析的方法
递归下降分析:

由一组过程组成，每个过程对应一个非终级符
由文法开始符号S对应的过程开始，其中递归调用文法中其他非终极符对应的过程

非终极符对应的过程是什么？以下是解释（以非终极符A为例）

void A()
{
    选择一个A产生式，A->X(1)X(2)...X(k);
    for(i = 1 to k)
    {
    	if(X(i)是一个非终极符)
    		调用过程X(i)();
    	else
    		{
    			if(X(i)等于当前的输入符号a)
    				读入下一个输入符号;
    			else
    				error();
    		}
    }
}

那么问题来了，如果A有多个产生式，且都含有输入符号a，那么应该怎样选择呢？
3. 逐个尝试，遇到错误就回溯，称为不确定的分析，效率低
4. 进行预测分析，通过在输入符号串中向前看固定个数（通常是1）符号来选择正确的A-产生式，不需要回溯，称为确定的分析

LL(k)文法分析：向前看k个输入符号的文法预测分析

leukocyten

关注

0
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
语法分析笔记（一）

目录推导最左推导最右推导规约句型和句子直接短语推导给定文法 G = ( V T\ _T T，V N\ _N N，P，S )，如果 α\alphaα→\rightarrow→β\betaβ ∈\in∈ P，那么可以将符号串γαδ\gamma\alpha\deltaγαδ中的 α\alphaα 替换为 β\betaβ ，也就是说，将 γαδ\gamma\...
复制链接

扫一扫