1 实验目的
根据自己确定的正规表达式,编写、调试一个词法分析程序,对语句进行词法分析,从而更好理解词法分析原理。
此程序用java编写。程序读取一个文本文件,并对其中的内容进行词法分析,此程序实现了对java程序简单的词法识别,可识别一部分保留字、标识符、操作符,一部分标点符号,同时可以识别行注释(形如//)和块状注释(形如/**/)。最终将识别的token写入指定文件名的文件,输出格式为{“type=”,”code=”,”error=”},对不符合可识别格式的字符进行错误处理。
针对要识别的单词符号写出正则表达式
构造出每个正则表达式对应的NFA
合并所有NFA,并化简为DFA
基于DFA编写代码
代码思路参考核心算法部分
AR1:保留字的优先级高于标识符
AR2:输入的文件是正常的简单的java程序
AR2:输入的java程序有大小限制,代码行数限制约20行及以内。
定义 a -> [a-zA-Z], d->[0-9], c为其他字符, ^*表示除*以为的字符,^/同理
标识符/保留字:(a)(a|d)*
数字: ((-)(d)*(.)( d)*)|( d)*|(-)( d)*|( (d)*(.)( d)*)
块注释(*表示为#): /# ( (^#^/)*|(#(^/)*)*|((^#)*/)* )* #/
行注释://(a|b|c)*(\n)
其他符号的较为简单,这里不再一一列出。
源码下载地址:https://www.write-bug.com/article/1781.html