从lex&yacc说到编译器(4.文法识别(一))

lex&yacc说到编译器(4.文法识别(一))

作者:tangl_99

QQ:8664220

msn:tangl_99@hotmail.com

email:tangl_99@sohu.com

没想到这一系列文件能得到csdn和大家的这么看好,首先要感谢大家的赏识和csdn的推荐.那么我就更没有理由不写好这下面的几篇文章了.本来我的计划是简单把lex和yacc介绍完后就直接进入编译器的构造的技术细节问题讨论,但是最近看了一些国外经典教材后,发现文法的识别问题在编译原理和技术中是个绝不能忽视的问题.即使现在有了yacc工具来帮助我来识别文法,但是有些时候还是需要我们自己来写简单的语法分析器.

 

1.什么是文法识别(语法分析)

首先要告诉大家的是,这里的文法识别是指的上下文无关的文法,也就是上一节我们一直在讨论的那些 BNF式.

 

比如说,我写了一句

if (a>6+5) printf(“OK!”); else printf(“No!”);

那么它匹配的文法也就是

if-stmt -> if expr stmt

         | if expr stmt else stmt

我们通常要为一个程序语言写出很多BNF式的文法,怎么知道这句话是匹配的哪个文法,这就是语法分析器(或者叫文法分析器要做的工作).知道了是那句文法后,我们才能对这句话做出正确的解释,所以文法识别是个不可忽视的工作.下面我来看看我们常使用的文法识别的算法.

 

2.自顶向下的算法(LL算法)

自顶向下的语法分析算法是十分简单的.自顶向下的算法也叫LL算法.LL(k)就是向前预测k个符号的自顶向下的算法.不过无论是我们国内的编译教程还是国外的经典教程都是只讨论了LL(1)算法.因为一般的程序语言,只使用LL(1)算法就已经足够了.这里我们同样也只是讨论LL(1)算法.

 

其中有种特殊的算法叫做递归下降的算法,在C语言中,由于函数本身是可以递归的,所以实现这种算法就只需要写简单的几个函数的递归过程就是了.

为什么叫自顶向下呢?因为在分析过程中,我们是从语法树的树顶逐步向树底分析的,所以叫自顶向下的算法.

 

为了方便说明自顶向下算法的简单性,我们来看一下<<Compilers Principles,Techniques,and Tools>>中的一个例子.(本系列文章经常要引用国外经典著作的范例,希望大家不要告我抄袭,我实在找不到比大师的范例更经典的范例了)

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
LexYacc是Unix系统中的常见工具,它们可以用于生成编译器的词法分析器和语法分析器。我们可以使用这两个工具来实现一个简单的C编译器。 下面是一个实现C编译器的基本步骤: 1. 设计语法规则:首先需要确定C语言的语法规则。可以参考C语言标准来确定语法规则,并将其表示为BNF范式。 2. 编写Lex文件:根据语法规则,编写Lex文件。Lex文件包含正则表达式和对应的动作,用于生成词法分析器。词法分析器会根据输入的源代码逐个读取字符并生成词法单元。 3. 编写Yacc文件:根据语法规则,编写Yacc文件。Yacc文件包含语法规则和对应的动作,用于生成语法分析器。语法分析器会根据词法分析器生成的词法单元,逐步构建语法树,并执行对应的动作。 4. 编写代码生成器:根据语法树,生成对应的目标代码。 下面是一个简单的例子,用于演示如何使用LexYacc生成C编译器: 首先,我们需要定义C语言的语法规则。例如,我们可以定义一个简单的语法规则,用于表示一个整数常量: ``` <constant> ::= <digit> | <digit> <constant> <digit> ::= 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 ``` 接下来,我们可以编写Lex文件,用于生成词法分析器。例如,我们可以编写如下的Lex文件: ```lex %{ #include <stdio.h> #include <stdlib.h> %} DIGIT [0-9] %% {DIGIT}+ { printf("CONSTANT: %s\n", yytext); return CONSTANT; } . { return yytext[0]; } %% int yywrap() { return 1; } ``` 在上面的代码中,我们使用了Lex的正则表达式来匹配整数常量。当遇到一个整数常量时,我们会打印出它的值,并返回对应的词法单元CONSTANT。 接下来,我们编写Yacc文件,用于生成语法分析器。例如,我们可以编写如下的Yacc文件: ```yacc %{ #include <stdio.h> #include <stdlib.h> #include <string.h> int yylex(); void yyerror(char *); %} %token CONSTANT %% program: statement_list ; statement_list: statement | statement_list statement ; statement: expression_statement ; expression_statement: CONSTANT ; %% void yyerror(char *s) { fprintf(stderr, "%s\n", s); } int main() { yyparse(); return 0; } ``` 在上面的代码中,我们定义了一个简单的语法规则,用于表示一个整数常量。当遇到一个整数常量时,我们会执行对应的动作。 最后,我们还需要编写代码生成器,用于生成对应的目标代码。由于这超出了本题的范围,这里不再给出具体实现。 综上所述,上述步骤就是使用LexYacc实现C编译器的基本步骤。当然,实际上还有许多细节需要考虑,例如错误处理、符号表管理等等。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

HashCodeWithJava

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值