YACC 实例分析



本文例子来自于 <<lex & yacc >> 第二版

 

LEX 负责词法分析,每次解析出一个 token。 

一、 token 的类型和值

token 具有类型,在计算器例子中,包括如下类型:

1)、 NUMBER     一串数字

2)、 NAME         一个名称

3)、 '+', '-', '*', '/' 等符号

同时 token 具有值,不同类型的 token, 值的含义不一样,例如, 

'1000':   类型是 NUMBER,值是1000

'abc':     类型是 NAME, 值是 'abc' 

 

LEX 解析出一个 token 后,将此 token 的值,保存在 yylval 变量中, 并将类型返回给 YACC。

为了能保存不同类型的值, yylval  被定义成 union

%union {
  double dval;
  struct symtab *symp;
}

其中, dval 保存 NUMBER 类型的值,symp 保存 NAME 类型的值。

为了保存 NAME 类型的值,定义了一个结构 

struct symtab {
    char *name;
    double (*funcptr)();
    double value;
} 

其中 name 记录了“符号”的名称,而 value 则用于保存计算结果,后文再介绍。

NAME 类型的 token,又被称为 “符号”, 跟我们写程序的时候定义的变量作用相同。

 

因此,当 LEX遇到数字串的时候,就把数字串的值保存到 yylval 的 dval 中,并返回 NUMBER 类型。遇到字符串的时候,根据字符串名称生成 symtab 结构,保存其名称,并将结构的地址保存到 yylval 的 symp 中,并返回 NAME 类型。遇到 '+', '-' 等符号的时候,则返回该符号的 ascii 码值。

 

二、 YACC 中的计算

在“产生式” 或者“规则”部分,通过 $1, $2, $3 的方式,可获取对应 token 的值,对这些变量的访问,实际就是对 yylval 的访问。此时,YACC 已经知道相应 token 的类型了,因此对 NUMBER 类型,token 的值就是 yylval.dval, 对 NAME 类型, token 的值就是  yylval.symp

例如:

statement:  NAME '=' expression { $1->value = $3;  printf("(%s) = (%g)\n", $1->name, $1->value); }<br> 

expression:  
|   NUMBER          { $$ = $1;   }
|   NAME            { $$ = $1->value; } 

对于 NUMBER, $1 对应的就是数值

对于 NAME, $1->name 就是符号名称

 

非终结符号的类型和值

%type <dval> expression

三、 附录: 源码

symbol.h

#define NSYMS 1024  /* maximum number of symbols */ 

struct symtab {
    char *name;
    double (*funcptr)();
    double value;
} symtab[NSYMS];

 
struct symtab *symlook(char* s);

symbol.c

#include "symbol.h"
#include <string.h>
#include <unistd.h>
#include <stdio.h>
#include <stdlib.h>

struct symtab *symlook(char* s)
{
    char *p;
    struct symtab *sp;

    for(sp = symtab; sp < &symtab[NSYMS]; sp++) {
        /* is it already here? */
        if(sp->name && !strcmp(sp->name, s)) {
            printf("found symbol: (%s)\n", sp->name);
            return sp;
        }

        /* is it free */
        if(!sp->name) {
            sp->name = strdup(s);
            printf("add symbol: (%s)\n", s);
            return sp;
        }
        /* otherwise continue to next */
    }
    yyerror("Too many symbols");

    exit(1);    /* cannot continue */
} /* symlook */

calc.l

%{
#include "y.tab.h"
#include "symbol.h"
#include <math.h>
%}

%%
([0-9]+|([0-9]*\.[0-9]+)([eE][-+]?[0-9]+)?) {
        yylval.dval = atof(yytext);
        return NUMBER;
    }

[ \t]   ;        /* ignore white space */

[A-Za-z][A-Za-z0-9]*    {   /* return symbol pointer */
        struct symtab *sp = symlook(yytext);
        yylval.symp = sp;
        return NAME;
    }

"$" { return 0; }

\n  |

.   return yytext[0];

%%
calc.y
%{
#include <string.h>
#include <math.h>
#include "symbol.h"
%}

%union {
    double dval;
    struct symtab *symp;
}

%token <symp> NAME

%token <dval> NUMBER

%left '-' '+'

%left '*' '/'

%nonassoc UMINUS

%type <dval> expression

%%

statement_list: statement '\n'
    |   statement_list statement '\n'
    ;

statement:  NAME '=' expression { $1->value = $3;  printf("(%s) = (%g)\n", $1->name, $1->value); }
    |   expression      { printf("= %g\n", $1); } 
    ;

expression: expression '+' expression { $$ = $1 + $3; }
    |   expression '-' expression { $$ = $1 - $3; }
    |   expression '*' expression { $$ = $1 * $3; }
    |   expression '/' expression
                {   if($3 == 0.0)
                        yyerror("divide by zero");
                    else
                        $$ = $1 / $3;
                }
    |   '-' expression %prec UMINUS { $$ = -$2; }
    |   '(' expression ')'  { $$ = $2; }
    |   NUMBER          { $$ = $1;   }
    |   NAME            { $$ = $1->value; }
    |   NAME '(' expression ')' {
            if($1->funcptr)
                $$ = ($1->funcptr)($3);
            else {
                printf("%s not a function\n", $1->name);
                $$ = 0.0;
            }
        }
    ;

%%


  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
作者: 胡彦 本框架是一个lex/yacc完整的示例,用于学习lex/yacc程序基本的搭建方法,在linux/cygwin下敲入make就可以编译和执行。 本例子虽小却演示了lex/yacc程序最常见和重要的特征: * lex/yacc文件格式、程序结构。 * 如何在lex/yacc中使用C++和STL库,用extern "C"声明那些lex/yacc生成的、要链接的C函数,如yylex(), yywrap(), yyerror()。 * 重定义YYSTYPE/yylval为复杂类型。 * 用%token方式声明yacc记号。 * 用%type方式声明非终结符的类型。 * lex里正则表达式的定义、识别方式。 * lex里用yylval向yacc返回属性值。 * 在yacc嵌入的C代码动作里,对记号属性($1, $2等)、和非终结符属性($$)的正确引用方法。 * 对yyin/yyout重赋值,以改变yacc默认的输入/输出目标。 * 如何开始解析(yyparse函数),结束或继续解析(yywrap函数)。 本例子功能是,对当前目录下的file.txt文件,解析出其中的标识符、数字、其它符号,显示在屏幕上。linux调试环境是Ubuntu 10.04。 总之,大部分框架已经搭好了,你只要稍加扩展就可以成为一个计算器之类的程序,用于《编译原理》的课程设计。 文件列表: lex.l: lex程序文件。 yacc.y: yacc程序文件。 main.hpp: 共同使用的头文件。 Makefile: makefile文件。 file.txt: 给程序解析的文本文件。 使用方法: 1-把lex_yacc_example.rar解压到linux/cygwin下。 2-命令行进入lex_yacc_example目录。 3-敲入make,这时会自动执行以下操作: (1) 自动调用flex编译.l文件,生成lex.yy.c文件。 (2) 自动调用bison编译.y文件,生成yacc.tab.c和yacc.tab.h文件。 (3) 自动调用g++编译、链接出可执行文件main。 (4) 自动执行main,得到如下结果:。 bison -d yacc.y g++ -c lex.yy.c g++ -c yacc.tab.c g++ lex.yy.o yacc.tab.o -o main id: abc id: defghi int: 123 int: 45678 op: ! op: @ op: # op: $ AllId: abc defghi 参考资料:《Lex和Yacc从入门到精通(6)-解析C-C++包含文件》, http://blog.csdn.net/pandaxcl/article/details/1321552 其它文章和代码请留意我的blog: http://blog.csdn.net/huyansoft 2013-4-27
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值