编译原理实验-递归下降语法分析

具体代码已放至Github(仅供参考):

qxpBlog/Compiler_UESTC: 电子科技大学编译原理实验 (github.com)

具体实验过程如下:

一、实验目的、原理、内容及步骤:

1目的:通过本实验加深对编译技术中重点算法和编译技术的理解,提高学生的编程能力培养好的程序设计风格。了解和掌握递归下降分析法的基本原理,根据给出的文法能够完成递归下降程序的实现。

2原理:递归下降分析器编译思想是简单的,从识别符号开始,在语法规则支配下进行语法分析,它逐个扫视源程序中的所有字符,根据文法和当前输入字符预测到下一个语法成份U时,便确定U为目标并调用分析和识别U的子程序,在分析U的过程中,又有可能确立其它(或自身)子目标并调用相应子程序,如此继续下去。

3内容:

1、学习所提供的“表达式文法”的递归下降处理

理解 lex.l、rdparser.c 的内容

在 vscode/Clion 中建立工程并调试运行

2、学习所提供的文法

与词法分析所提供的文法作比较

3、编写 rdgram 所提供文法的递归下降程序

(1) 编写不生成“语法树”的递归下降程序 rdcheck.c

(2) 将 rdcheck.c 改造为生成语法树的递归下降程序 rdparser.c

(3) 改进词法分析程序、showAst 函数、main 函数等,使递归下降程序 rdparser最终从命令行读取要分析的程序 test.c,分析后调用 showAst 打印该程序的结构。

4实验步骤:

1)编写不生成“语法树”的递归下降程序 rdcheck.c

主函数如图1-1所示,主要采取一个无限循环结构来实现多次对所输入的文法进行递归下降语法分析,并将分析结果打印出来。

图 1-1 rdcheck文件main函数

编写两个常用的函数:match匹配函数、advance移进函数,如图1-2所示。

图 1-2 match函数与advance函数定义

用这两个函数来实现将所输入的字符串与sysy文法进行逐一匹配。match函数主要用来检查sysy文法中的终结符是否与输入串中的当前字符匹配,如果匹配那么就是用调用advance,将下一个待分析的字符设置为当前字符,之后再调用文法中剩余字符对应的函数进行匹配;如果不匹配,则返回-1,表示文法匹配出错。

对于开始符号CompUnit的文法规则,如图1-3所示。

图 1-3 CompUnit的文法规则

由于其包含公共左因子,所以我们首先要消除公共左因子,改造后的语法规则如图1-4所示。

图 1-4 改造后的CompUnit的文法规则

其对应的语法分析函数CompUnit, CompUnit_,如图1-5所示。

图 1-5 CompUnit、CompUnit_函数定义

sysy文法程序开始可能包含两个部分变量或常量声明(定义)和函数定义。如果输入串是变量或常量声明,那么就进入其对应语法规则左侧非终结符函数Decl(),进行下一步的匹配;如果是函数定义,那么就进入对应的函数FuncDef,进行下一步的匹配。如果下一步也匹配成功,则说明输入串符合sysy文法,并返回1,否则,则表明输入串不符合sysy文法,返回0。

对于sysy文法中的语句Stmt的文法规则,如图1-6所示。

图 1-6 Stmt的语法规则

由于该文法规则中含有公共左因子,所以需要消除其公共左因子,改造后的文法规则如图1-7所示。

图 1-7 改造后的Stmt的语法规则

对应的Stmt函数如图1-8(a)、图1-8(b)、图1-8(c)、图1-8(d)所示。

图 1-8(a) Stmt函数定义

图 1-8(b) Stmt函数定义

图 1-8(c) Stmt函数定义

图 1-8(d) Stmt函数定义

假设输入串是一个while语句,那么在Stmt函数中,match函数会首先匹配while语句中前缀部分的终结符:‘while’、‘(’,之后需要匹配一个由非终结符LorExp产生的循环条件表达式单词序列,因此进入对应的函数LorExp,识别由该非终结符生成的单词序列。之后继续使用match函数匹配非终结符‘)’,最后进入函数Stmt,匹配由非终结符Stmt产生的单词序列。如图1-9所示

 

图 1-9 while语句处理

对于sysy文法中的表达式Exp的语法规则,如图1-10所示。

 

图 1-10 Exp表达式语法规则

对应的Exp函数如图1-11所示。

图 1-11 Exp函数定义

 

在sysy文法中,表达式就是加减表达式,因此在对表达式进行递归下降语法分析时,会进入AddExp函数,识别由非终结符AddExp产生的单词序列。

该递归下降分析程序对输入串“int main(){while(1==2){return 0;}}”的识别结果如图1-12所示。

 

图 1-12 识别结果

2)将 rdcheck.c 改造为生成语法树的递归下降程序 rdparser.c

将rdcheck.c改造后,生成Stmt语句结点的函数astStmt如图2-1(a)、图2-1(b)、图2-1(c)、图2-1(d)、图2-1(e)所示。

 

图 2-1(a) 生成Stmt结点函数astStmt定义

 

图 2-1(b) 生成Stmt结点函数astStmt定义

 

图 2-1(c) 生成Stmt结点函数astStmt定义

 

图 2-1(d) 生成Stmt结点函数astStmt定义

 

图 2-1(e) 生成Stmt结点函数astStmt定义

在语句结点中,关于if语句结点生成的代码部分如图2-2所示。

 

图 2-2 生成if语句结点代码

在构建抽象语法树(AST)的过程中,我们将舍弃一些无用的界符,例如‘;’、‘(’、‘)’等,方便编译后续阶段的进行。因此在构建if语句结点时,用match匹配终结符‘if’、‘(’并将其舍弃,如果匹配成功则之后进入函数astLorExp,生成条件判断表达式结点l;反之匹配失败,返回NULL。之后匹配终结符‘)’并将其舍弃,如果匹配成功,那么就进入函数astStmt,生成复合语句结点CompoundStmt,反之则匹配失败,返回NULL。之后,如果能够匹配字符‘else’,那么就继续进入astStmt函数,生成复合语句结点CompoundStmt,最后返回生成的if语句结点;反之,则输入串中无else语句,那么直接返回不含else语句的if语句。

对于生成加减表达式结点的函数astAddExp定义如图2-3所示。

 

图 2-3 生成加减表达式结点函数astStmAddExp定义

在生成加减表达式结点的时候,根据AddExp文法可知,加减表达式包含右递归,其每个操作数都可能是由若干个其他表达式构成,因此采用while循环结构来生成加减表达式结点。

3)该进词法分析程序、showAst 函数、main 函数等,使递归下降程序 rdparser最终从命令行读取要分析的程序 test.c,分析后调用 showAst 打印该程序的结构。

改进后的main函数如图3-1所示。

 

图 3-1 改进后的main函数

从文法开始符号CompUnit对应的函数astCompUnit开始构建输入串的抽象语法树(AST),并将抽象语法树(AST)的根节点返回给node,之后调用函数showAst打印生成的抽象语法树(AST)。

改进后的showAst函数如图3-2(a)、图3-2(b)所示。

 

图 3-2(a) 改进后的showAst函数

 

图 3-2(b) 改进后的showAst函数

在showAst函数中,对与不同的结点类型,我们将打印不同的信息。

对于函数形参结点,我们调用showParaDecl函数对其所包含的结点进行打印,如图3-3所示。由于构建函数形参结点的时候我们是逆序构建,因此需采用非递归中序遍历的算法对其结点进行打印,以便保证函数形参顺序的正确。

 

图 3-3 showParaDecl函数定义

对于复合语句,我们调用showCompoundStmt函数对其所包含的结点进行打印,如图3-4所示。由于构建函数形参结点的时候我们是顺序序构建,并且假定只有left结点才是真正的语句结点,因此我们只需逐一访问每一层复合语句结点的左子结点并打印其所包含的信息即可。

   

 

图 3-4 showCompoundStmt函数定义               

对于函数调用结点,我们调用showCallExp函数对其所包含的结点进行打印,如图3-5所示。由于构建函数形参结点的时候我们是顺序序构建,并且假定只有left结点才是真正的语句结点,因此我们只需逐一访问每一层复合语句结点的左子结点并打印其所包含的信息即可。

   

 

图 3-5 showCallExp函数定义    

           

对于编译单元,我们调用showTranstion函数对其所包含的结点进行打印,如图3-6所示。由于构建函数形参结点的时候我们是顺序序构建,并且只有left结点才是变量结点或常量结点或者函数定义节点,因此我们只需逐一访问每一层编译单元结点的左子结点并打印其所包含的信息即可。

 

 图 3-6 showTrasntion函数定义

二、实验运行结果:

(1)测试用例1:在终端输入字符串“int main(int m, int n){l = 1 + 2; while(1 == 2){ l = l + 1;} }” ,程序运行结果如图4-1所示。

 

图 4-1 测试用例1运行结果

(2)测试用例2:在终端输入字符串“int main(int m, int n){l = 1 + 2; if(1 > 2){return 1;} } ” ,程序运行结果如图4-2所示。

 

图 4-2 测试用例2运行结果

(3)测试用例3:在终端输入字符串“int main(int m, int n){l = 1; if(6 < 2){return 1;}else {return 5;} }” ,程序运行结果如图4-3所示。

 

图 4-3 测试用例3运行结果

(4)测试用例4:在终端输入字符串“int func(){return 1;} int main(){int l = func();}”,程序运行结果如图4-4所示。

 

图 4-4 测试用例4运行结果

三、实验结论与总结:

        本次实验所实现的递归下降分析程序,能够完成对sysy文法中函数定义、函数形参、语句块、语句、表达式等部分的语法分析,并能够生成相应的抽象语法树(AST)。较好的完成了本次实验的要求。

        通过本次实验,了解和掌握了递归下降分析法的基本原理,并且能够根据给出的文法完成递归下降程序的实现。同时也对编译过程中词法分析这一环节有了一个更加深刻的认知。同时,在实验的过程中也逐渐地的意识到递归下降分析法的缺陷所在:对含有公共左因子和左递归的文法词法分析效果较差。

  • 32
    点赞
  • 62
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
递归下降分析法 一、实验目的: 根据某一文法编制调试递归下降分析程序,以便对任意输入的符号串进行分析。本次实验的目的主要是加深对递归下降分析法的理解。 二、实验说明 1、递归下降分析法的功能 词法分析器的功能是利用函数之间的递归调用模拟语法树自上而下的构造过程。 2、递归下降分析法的前提 改造文法:消除二义性、消除左递归、提取左因子,判断是否为LL(1)文法, 3、递归下降分析法实验设计思想及算法 为G的每个非终结符号U构造一个递归过程,不妨命名为U。 U的产生式的右边指出这个过程的代码结构: (1)若是终结符号,则和向前看符号对照, 若匹配则向前进一个符号;否则出错。 (2)若是非终结符号,则调用与此非终结符对应的过程。当A的右部有多个产生式时,可用选择结构实现。 三、实验要求 (一)准备: 1.阅读课本有关章节, 2.考虑好设计方案; 3.设计出模块结构、测试数据,初步编制好程序。 (二)上课上机: 将源代码拷贝到机上调试,发现错误,再修改完善。第二次上机调试通过。 (三)程序要求: 程序输入/输出示例: 对下列文法,用递归下降分析法对任意输入的符号串进行分析: (1)E->eBaA (2)A->a|bAcB (3)B->dEd|aC (4)C->e|dc 输出的格式如下: (1)递归下降分析程序,编制人:姓名,学号,班级 (2)输入一以#结束的符号串:在此位置输入符号串例如:eadeaa# (3)输出结果:eadeaa#为合法符号串 注意: 1.如果遇到错误的表达式,应输出错误提示信息(该信息越详细越好); 2.对学有余力的同学,可以详细的输出推导的过程,即详细列出每一步使用的产生式。 (四)程序思路 0.定义部分:定义常量、变量、数据结构。 1.初始化:从文件将输入符号串输入到字符缓冲区中。 2.利用递归下降分析法分析,对每个非终结符编写函数,在主函数中调用文法开始符号的函数。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

实名吃香菜

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值