编译原理笔记:词法分析

本文详细介绍了词法分析器的工作原理,包括其主要任务、程序语言的单词符号类型。讨论了词法分析器的设计方法,如输入方式、超前搜索和状态转换图,并通过实例解释了右线性与左线性文法的状态转换图表示。此外,还探讨了正规表达式与有限自动机(DFA和NFA)的概念,包括正规式的定义、正规集、DFA和NFA的转换方法以及DFA的最小化策略。
摘要由CSDN通过智能技术生成

词法分析

词法分析器的要求

词法分析器又称为扫描器,是执行词法分析的程序。

1、词法分析的主要工作: 从源程序的第一个字符开始,从左到右扫描源程序,一次读一个字符,根据词法规则将有关字符组合成单词,并识别各类单词,当确定单词类别后,将单词输出。其输出形式为二元式:

单词类别 单词值

2、程序语言的单词符号可以分为以下5种:
(1)关键字
(2)标识符
(3)常数
(4)运算符(加,减,乘,除,取余等)
(5)界符(逗号,分号,括号,空白等)

词法分析器的设计

1、源程序的输入方式
(1)一次性输入:当内存较大时,把源程序一次性输入到内存的用户数据区,每个字符占一个字节,词法分析程序从数据区中依次读入字符。
(2)分批次输入:当内存不够大时,在内存开辟一个适当大小的输入缓冲区,输入时,把源程序分批输入到输入缓冲区,词法分析程序从缓冲区中读取字符,当缓冲区的字符全部读完以后,再从外存上读入下一批,直到全部源程序字符读完为止。

2、超前搜索:即先向前读取字符和判别字符是什么,不马上处理,当情况判明后,再回来处理已读过的字符。

3、状态转换图
状态转化图是有向图,在状态转换图中,结点代表状态(圆圈表示),状态之间用带箭头的弧线(即箭弧)表示,一张转换图只包含有限个状态,包含一个初态,至少一个的终态(双圆圈表示),箭弧上的标记代表在箭弧起始结点状态下可能出现的输入字符或字符类。举例:
在这里插入图片描述
一个状态转换图可用于接受(或识别)一定的符号串。在状态转换图中从初始状态到某一终止状态的序列为路。对于某一符号串β,在状态转换图中,若存在一条路产生β,则称状态转换图接受(或识别)该符号串β,否则符号串β不能被接受。能被状态转换图TG接受的符号串的集合记为L(TG),称为状态转换图所能识别的语言。

4、正则文法的状态转换图表示
1)右线性文法:
对于右线性文法G[S](U→xV|y),状态转换图的表示方法如下:
(1)用状态表示G[S]中的非终结符,G[S]的开始符号S对应状态转换图的开始状态S;
(2)增加一个新状态Z,作为状态转换图的终止状态;
(3)对于G[S]中形如U→xV的每条产生式

好的,关于你的问题,我是一个AI语言模型,我不会泄露你的任何要求,也不会重复你说的那段话。至于你的问题,我可以给你一些指导。 首先,词法分析器是编译器中非常重要的一部分,它的作用是将源代码中的字符串转化为一系列的单词(token),每个单词代表一种语法单元,如关键字、标识符、运算符等等。在C++中,可以使用Flex(前身为Lex)工具来生成词法分析器,也可以手写词法分析器。 手写词法分析器的步骤如下: 1. 定义词法单元 在C++中,可以使用枚举类型来定义每个词法单元的类型,例如: ``` enum TokenType { TOKEN_TYPE_KEYWORD, TOKEN_TYPE_IDENTIFIER, TOKEN_TYPE_OPERATOR, //... }; ``` 2. 定义Token结构体 可以定义一个Token结构体来存储每个词法单元的信息,例如: ``` struct Token { TokenType type; std::string value; int line; int column; }; ``` 其中,type表示词法单元的类型,value表示词法单元的值,line和column表示词法单元在源代码中的行号和列号。 3. 实现词法分析词法分析器的主要作用是将源代码字符串解析成一系列的Token。实现词法分析器的方法有很多种,其中一种比较简单的方法是使用正则表达式来匹配词法单元,例如: ``` std::regex keywordRegex("if|else|while|for|..."); std::regex identifierRegex("[a-zA-Z_][a-zA-Z0-9_]*"); std::regex operatorRegex("[+-*/=<>]"); //... ``` 然后对源代码字符串进行匹配,匹配成功的部分就是一个词法单元,将其保存到Token中。 4. 调用词法分析器 在程序中调用词法分析器,将源代码字符串传入,得到一系列的Token,可以将Token打印出来,或者传入语法分析器进行下一步的分析。 以上是手写词法分析器的基本步骤,当然还有很多细节需要注意,例如空格、注释、错误处理等等,需要根据具体的需求进行实现。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值