编译原理第三弹——语法分析

学习完相关词法分析的知识,我们按部就班,进行编辑器工作的第二个流程——语法分析,顾名思义,语法分析就是在词法分析的基础上进一步工作,主要针对词法分析器输出的token序列进行处理,目标当然是构造一个高效率、无误差的语法分析树。

语法分析树

   

上述图很好的解释了什么是语法树,能够识别单词所构成的句子是否符合语法规则。

语法树的构造方式

    主要分为自顶向下语法分析与自底向上语法分析,首先摆在我们面前的有两个问题需要解决。

  1. 替换当前句型中的哪个非终结符
  2. 用该非终结符的哪个候选式进行替换

针对上述问题提出解决方案。

第一个问题

    主要两种解决方案,最左推导最右推导,即每次固定选择最左边(右边)的非终结符进行替换。

其中根据最左或者最右规定产生的语法树是唯一的。

第二个问题

    这个问题相对复杂一点,一旦没有做好这步,很容易产生回溯、无限循环等问题。因此我们需要考虑多种因素产生的结果。

同时我们需要保证文法设计的合理性,避免这些情况的发生。需要针对不同构造方式进行选择。

自顶向下的语法分析

    自顶向下的语法分析,一般采用最左推导解决第一问题。根据输入流中的下一个终结符,选择最左非终结 符的一个候选式。

   自顶向下语法分析的通用形式——递归下降分析 
    单纯这样很有可能产生回溯现象。即在某一次选择产生式的时候,选择并不唯一,只能采用试探的方法,如果错了就要回溯,这样大大降低了处理效率,于是需要进行优化,我们提出预测分析,使得每一次抉择都是正确且唯一的。预测分析不仅可以解决回溯现象还能解决递归产生的无限循环。
    回溯
    首先我们应该明白回溯现象的产生原因——同一非终结符的多个候选式存在共同前缀,将导致回溯现象。

    解决—提取左公因子算法,通过改写产生式来推迟决定,等读入了足够多的输入,获得足够信息后再做出正确的选择。


    无限循环

        如果一个文法中有一个非终结符A使得对某个串α存在一个推导 ,那么这个文法就是左递归的,左递归文法会使递归下降分析器进入无限循环。

含有A→Aα形式产生式的文法称为是直接左递归,采用如下算法进行消除。


经过两步或两步以上推导产生的左递归称为是间接左递归



  • 0
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
附录c 编译程序实验 实验目的:用c语言对一个简单语言的子集编制一个一遍扫描的编译程序,以加深对编译原理的理解,掌握编译程序的实现方法和技术。 语法分析 C2.1 实验目的 编制一个递归下降分析程序,实现对词法分析程序所提供的单词序列的语法检查和结构分析. C2.2 实验要求 利用C语言编制递归下降分析程序,并对简单语言进行语法分析. C2.2.1待分析的简单语言的语法 实验目的 通过上机实习,加深对语法制导翻译原理的理解,掌握将语法分析所识别的语法成分变换为中间代码的语义翻译方法. 实验要求 采用递归下降语法制导翻译法,对算术表达式、赋值语句进行语义分析并生成四元式序列。 实验的输入和输出 输入是语法分析提供的正确的单词串,输出为三地址指令形式的四元式序列。 例如:对于语句串 begin a:=2+3*4;x:=(a+b)/c end# 输出的三地址指令如下: (1) t1=3*4 (2) t2=2+t1 (3) a=t2 (4) t3=a+b (5) t4=t3/c (6) x=t4 算法思想 1设置语义过程 (1) emit(char *result,char *arg1,char *op,char *ag2) 该函数功能是生成一个三地址语句送到四元式表中。 四元式表的结构如下: struct {char result[8]; char ag1[8]; char op[8]; char ag2[8]; }quad[20]; (2)char *newtemp() 该函数回送一个新的临时变量名,临时变量名产生的顺序为T1,T2,…. Char *newtemp(void) { char *p; char m[8]; p=(char *)malloc(8); k++; itoa(k,m,10); strcpy(p+1,m); p[0]=’t’; return(p); } (2)主程序示意图如图c.10所示。 (2) 函数lrparser在原来语法分析的基础上插入相应的语义动作:将输入串翻译成四元式序列。在实验中我们只对表达式、赋值语句进行翻译。 语义分析程序的C语言程序框架 int lrparser() { int schain=0; kk=0; if(syn=1) { 读下一个单词符号; schain=yucu; /调用语句串分析函数进行分析/ if(syn=6) { 读下一个单词符号; if(syn=0 && (kk==0)) 输出(“success”); } else { if(kk!=1 ) 输出 ‘缺end’ 错误;kk=1;} else{输出’begin’错误;kk=1;} } return(schain); int yucu() { int schain=0; schain=statement();/调用语句分析函数进行分析/ while(syn=26) {读下一个单词符号; schain=statement(); /调用语句分析函数进行分析/ } return(schain); } int statement() { char tt[8],eplace[8]; int schain=0; {switch(syn) {case 10: strcpy(tt,token); scanner(); if(syn=18) {读下一个单词符号; strcpy(eplace,expression()); emit(tt,eplace,””,””); schain=0; } else {输出’缺少赋值号’的错误;kk=1; } return(schain); break; } } char *expression(void) {char *tp,*ep2,*eplace,*tt; tp=(char *)malloc(12);/分配空间/ ep2=(char *)malloc(12); eplace=(char *)malloc(12); tt =(char )malloc(12); strcpy(eplace,term ());/调用term分析产生表达式计算的第一项eplace/ while(syn=13 or 14) { 操作符 tt= ‘+’或者‘—’; 读下一个单词符号; strcpy(ep2,term());/调用term分析产生表达式计算的第二项ep2/ strcpy(tp,newtemp());/调用newtemp产生临时变量tp存储计算结果/ emit(tp,eplace,tt,ep2);/生成四元式送入四元式表/ strcpy(eplace,tp); } return(eplace); } char *term(void)/仿照函数expression编写/ char *factor(void) {char *fplace; fplace=(char *)malloc(12); strcpy(fplace, “ ”); if(syn=10) {strcpy(fplace,,token);/将标识符token的值赋给fplace/ 读下一个单词符号; } else if(syn=11) {itoa(sum,fplace,10); 读下一个单词符号; } else if (syn=27) {读下一个单词符号; fplace=expression();/调用expression分析返回表达式的值/ if(syn=28) 读下一个单词符号; else{输出‘}’错误;kk=1; } } else{输出‘(’错误;kk=1; } return(fplace); }
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值