Flex生成文件分析

本文深入分析Flex生成的词法分析器代码,重点讨论lex.yy.c中的自动机逻辑处理。通过-Cf参数,自动机转换函数表现为二维表yy_nxt[][128]。内容涵盖可运行模板、自动机结构、识别过程,并举例说明如何将正则表达式映射到转换表中。
摘要由CSDN通过智能技术生成

本文参考龙书,分析了Flex生成词法分析器代码

首先给出一个可以运行的模板,修改其中

%%

转换规则

%%

的转换规则部分即可测试不同正则表达式生成代码并编译运行查看结果

一个可运行代码

%{
#include "stdio.h"
%}

%%
a   { printf("match%s\n", yytext); }
%%

int yywrap()
{
    return 1;
}

int main()
{
    yylex();
}


说明

生成的代码lex.yy.c主要包括两部分内容:字符串缓存处理与自动机逻辑处理,学习词法分析主要关心自动机逻辑处理

Flex编译的时候如果加参数 -Cf,则编译结果代码中自动机转换函数是一个二维表yy_nxt[][128],否则,则为龙书3.9.8中的4个数组结构

生成代码中有些内容做些说明:

#line 3 "lex.yy.c"      // 下一行表示lex.yy.c第3行

关于do...while(0)使用,可以参考一片转载的文章。

生成代码中有很多宏定义,比如YY_USER_ACTION    每次匹配成功执行的代码,详细信息Flex文档中有详细说明

例子说明自动机结构

如果不压缩转换表,以匹配正则表达式a为例,则得到:

共6个状态

yy_accept={0, 0, 0, 3, 2, 1);

yy

要用Flex生成PL语言的词法分析器,我们首先需要了解Flex是什么。Flex是一种工具,用于自动生成词法分析器。它接受一个包含正则表达式规则的输入文件,并根据这些规则生成C/C++代码。 在开始之前,我们应该先定义PL语言的词法规则。PL语言是一种编程语言,因此它的词法规则可能包括关键字(如if、while等)、运算符(如+、-等)、标识符、常量等。 在Flex中,我们可以使用正则表达式来定义这些词法规则。例如,我们可以使用正则表达式"if"定义关键字if;正则表达式"[0-9]+"定义常量;正则表达式"[a-zA-Z_][a-zA-Z0-9_]*"定义标识符。 定义完词法规则后,我们需要将这些规则编写到一个Flex输入文件中。这个文件通常以.l作为后缀名,例如pllexer.l。 接下来,我们使用Flex工具对这个输入文件进行处理,生成C/C++代码。假设我们使用以下命令执行这个过程:flex pllexer.l。这将生成一个名为lex.yy.c的文件,其中包含了用于词法分析的C代码。 最后,我们需要将生成的C代码与PL语言的语法分析器进行整合,以实现完整的编译器。这可能涉及到词法分析器的调用、标记的传递等操作,并且需要根据PL语言的语法规则进行相应的处理。 总之,使用Flex生成PL语言的词法分析器大致包括了定义PL语言的词法规则、编写Flex输入文件、使用Flex工具生成C/C++代码,以及与语法分析器整合等过程。通过这些步骤,我们可以生成一个可用于词法分析的PL语言编译器。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值