实验介绍
词法分析器的功能是:输入源程序,按照构词规则分解成一系列单词符号。
单词是语言中具有独立意义的最小单位,包括关键字、标识符、运算符、界符和常量等
(1) 关键字 是由程序语言定义的具有固定意义的标识符。例如,Pascal 中的begin,end,if,while都是保留字。这些字通常不用作一般标识符。
(2) 标识符 用来表示各种名字,如变量名,数组名,过程名等等。
(3) 常数 常数的类型一般有整型、实型、布尔型、文字型等。
(4) 运算符 如+、-、*、/等等。
(5) 界符 如逗号、分号、括号、等等。
实验内容
输入: 给定一段源程序代码
int a = 1;
while(a <= 10a){
a++;
}
输出: token 表和 error表, 两个表都是三元组列表(行数, 单词, 类型). token表记录分析出的单词,error表记录程序代码的错误.
实现原理
c语言子集对应的状态转换图
程序源码
source.txt 中存放要分析的源程序
int a = 1;
while(a <= 10a){
a++;
}
main.py 存放分析程序代码
def is_alphabet(c):
# 判断是否是字母
if 'a' <= c <= 'z' or &#