Lex词法分析器

Lex词法分析器

一.设计内容

熟悉并实现一个简单的词法分析器

二.设计目的

了解高级语言单词的分类,了解如何识别单词规则,掌握状态图到识别程序的编程。
源程序中,存在许多编辑用的符号,他们对程序逻辑功能无任何影响。例如:回车,换行,多余空白符,注释行等。在词法分析之前,首先要先剔除掉这些符号,使得词法分析更为简单。

三.实验步骤

Lex输入文件由3个部分组成:

定义集(definition),规则集(rule)和辅助程序集(auxiliary routine)或用户程序集(user routine)。

这三个部分由位于新一行第一列的双百分号分开,因此,Lex输入文件的格式如下 :

{definitions}
%%
{rules}
%%
{auxiliary routines}

将每个单词符号进行不同类别的划分。单词符号可以划分成5种:

  1. 标识符:用户自己定义的名字,常量名,变量名和过程名。
  2. 常数:各种类型的常数。
  3. 保留字(关键字):如if、begin、then、while、do等。
  4. 运算符:如+、-、*、<、>、=等。
  5. 界符:如逗号、分号、括号等。

将各类单词对应到lex中:

词法分析器所输出单词符号常常表示成单词种别,单词符号的属性值的二元式:

单词种别通常用整数编码。标识符一般统归为一种。常数则宜按类型(整、实、布尔等)分种。关键字可将其全体视为一种。运算符可采用一符一种的方法。界符一般用一符一种的方法。对于每个单词符号,除了给出了种别编码之外,还应给出有关单词符号的属性信息。单词符号的属性是指单词符号的特性或特征。

  1. 保留字:

定义识别保留字规则

reserved_word [const|var|procedure|begin|end|if|then|while|do|read|call|write|writeln]

由于在lex中不区分大小写,所以将保留字写成:

reserved_word [cC][oO][nN][sS][tT]|[vV][aA][rR]|[pP][rR][oO][cC][eE][dD][uU][rR][eE]|
[bB][eE][gG][iI][nN]|[eE][nN][dD]|[iI][fF]|[tT][hH][eE][nN]|[wW][hH][iI]
[lL][

  • 6
    点赞
  • 75
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
编译原理中的词法分析器是一个重要的组成部分,其作用是将源代码转化为一系列的词法单元(tokens)。其中,词法单元是指编程语言中的最小的、有意义的、不可再分的单词,如关键字、标识符、运算符、常量等。 lex是一种常用的词法分析器生成器,它的工作原理是基于正则表达式匹配规则。使用lex的时候,我们需要使用一种被称为lex源文件的文件,其中包含词法规则描述和对应的动作。 在编写lex源文件时,我们需要定义一系列的正则表达式规则,用于匹配不同类型的词法单元。每个规则通常由两部分组成:模式(pattern)和动作(action)。模式用于描述词法单元的形式,而动作则指定了在匹配到该模式时的处理方式。 lex根据这些规则生成一个有限状态自动机,并用于从输入的源代码中识别和提取出对应的词法单元。生成的词法分析器可以作为编译过程的第一步,将源代码分解为一系列的词法单元,供后续的语法分析器使用。 使用lex可以极大地简化词法分析器的编写工作,同时提高了分析效率。通过定义灵活的正则表达式规则,我们可以轻松地适应不同编程语言的需求。 总结起来,词法分析器编译原理中起着至关重要的作用。lex作为一种词法分析器生成器,可以帮助我们快速构建词法分析器,从源代码中提取出有意义的词法单元,为后续的编译过程打下基础。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值