过了个五一小假期,调整了一下心情做完了前久积攒的作业,感觉甚是轻松。前久困扰我的事情已经尘埃落定了,也有了新的发展目标。开这个专栏本意就是把本科期间做过的有意思的课程作业放上来大家一起学习进步,淘了淘把编译原理排上号了,接下来的几篇文章应该都是与之相关的~感谢大家阅读!代码用的是MFC,框架简单上手快,还是大二数据结构课设的时候助教教的,很实用。MFC程序的设计需要遵循面向对象的原则,简单来说就是要把你实现的程序封装成类,这样就可以在它生成的对话框类中建立有关该类的对象并完成功能函数的调用。
PS:代码真的很简单,因为当时老师要求手写这个过程所以就放上来了。通常分词可以用正则表达来做,不用自己一个字符一个字符的手写。可能可视化方面会比较有意思吧。有什么不对的地方还请批评指正,谢谢~
一、实验目标
1、了解形式语言与自动机理论在计算机中的应用。
2、了解计算机对语言的处理方式,并能掌握词法分析的原理。
3、在上述基础上,编写词法分析器。这里我实现了对51个符号的识别。
二、设计说明
1. 功能设计及原理说明
1.1 实验原理
(1) 编译程序
通常编译程序的流程为如下所示:
(2) 词法分析的用处和要点
词法分析的要点在于识别字符串并进行分类。由此可知,词法分析是编译程序的第一步,也是往下进行其他步骤的基础。在本次课程中识别的字符如下:
1.2 功能模块
(1)预处理模块
该部分主要是完成对注释的处理和多余空格的处理,方便接下的处理。
(2)界符处理模块
该部分主要是完成对界符的处理和判断。
(3)运算符的处理
该部分主要是完成对运算符的处理和判断。除调用函数换为is_operator()之外,处理流程与界符处理函数一致。
(4)字母开头的字符串处理
该部分主要是完成对字母开头的字符串的处理和判断。
(5)数字字符串的处理
该部分的处理方式与字母的处理相类似,该字符串全是数字就识别为数字,否则识别为其他。
2. 详细代码
该部分主要介绍了进行词法分析的类的结构。
class
三、测试/调试过程
1. 调试环境
Visual Studio 2103professional 的集成开发环境,图形界面主要是利用MFC来完成。
2. 调试过程
由于在MFC里把所有的操作函数和操作对象都定义成了Malex类,所以只需分别调试每个类函数即可。最后调用CPOE(ifstream)函数处理整个流程即可。
3. 使用流程
(1)双击打开运行程序出现如下界面。
(2)点击预处理按钮,选择预处理的文件。(注:此处为.cpp类型,可在测试函数文件夹下选)
(3)打开文件后点击词法分析即可。
四、结论
1、本次词法分析完成了51个符号的识别(不包括标识符),以及单行注释的预处理过程。
2、还包括了< >处理成界符还是运算符的不同情况下的处理。
3、经测试后本程序在上述条件下正确。
总结:该词法分析器能完成12个界符,19个运算符,20个保留字的识别。
五、参考资料
[1]陈火旺﹒《编译原理》(第三版)﹒国防工业出版社
[2]谭浩强.《C++程序设计》(第二版).北京:清华大学出版社,2014-4
[3]严蔚敏,吴伟民.《数据结构》(C语言版).北京:清华大学出版社,2015-5
[4]侯俊杰.《深入浅出MFC》(第二版).武汉.华中科技大学出版社.2002-9
[5]姚领田.《精通MFC程序设计》.北京.人民邮电出版社.2005
KristinKong/CompileTheory-LexicalAnalysisgithub.com