直接粘实验报告,debug的时间较少,估计还有很多错儿,有些情况没考虑到。不过状态机的基本思路就是这样,其他的部分可以自行删改。
一、实验概述
1.1、实验要求
选择计算机高级语言之一-----C语言,运用恰当的此法分析技术线路,设计和实现其对应的词法分析器。
建议:编程语言,选择《计算机程序设计》课程所采用的语言。
提示:技术线路选择如下两种之一:
正则式→NFA→DFA→minDFA→程序设计
或正则文法→NFA→DFA→minDFA→程序设计。
要求:分析器输出结果存入到磁盘文件中,具有出错处理功能。
1.2、实验目的
1)加深对编译原理及其构造词法分析器的原理和技术理解与应用,进一步提高学生编程能力;
2)培养、提高学生分析问题、解决问题的综合能力;
3)整理资料,撰写规范的实验报告;
二、系统分析
2.1、系统需求
根据C语言语法,待分析的词可以分为如下几类:
(1) 关键字
如if, else, whlile, int 等。
(2) 标示符
开头只能为字母,后面可以接数字或者字母,用来表示各种名字,如变量名、常量名和过程名等
(3) 常数
各种类型的常数,如整型(1, 30),浮点型(2.16),字符串型(”AHD”),字符型(’A’)
(4) 运算符与界符
如+, *, <= , 逗号等。
2.2、系统功能
读入一个C语言源程序(经过预处理的),对每一个单词输出一些三元组的集合。
2.3、系统实现步骤
按照如下顺序构造词法分析器:
(1) 设计出各类单词的正规式,画出有限状态自动机。
(2) 将各类单词的正规式转换成相应的NFA M,并将其合并成一个NFA M`
(3) 将NFA M`转换成对应的DFA M``
(4) 将DFA M``最小化为DFA M```
(5) 根据DFA M```用C语言设计出相应的词法分析器。
三、系统设计
3.1、有限状态自动机设计
状态机说明:由于单词的构成较为复杂,所以再设计时,边的变迁不再是一个字符,而是一个函数。若当前输入串满足该函数,则当前状态可以变迁到该边连接的下一状态。
根据终态可以看出自动机可以分离的状态有:
INT |
整数 |
FLOAT |
浮点数 |
CHAR |
字符型 |
CHARS |
字符串型 |
IDENT |
标识符(包括关键字) |
SYMBOL |
符号 |
其中,关键字的分离在辅助程序中进行。
3.2、单词符号对应的种别码
种别码 |
单词符号及说明 |
种别码 |
单词符号及说明 |
0 |
INT(整数) |
30 |
>= |
1 |
FLOAT(浮点数) |
31 |
<= |
2 |
CHAR(字符型) |
32 |
> |
3 |
CHAR(字符串型) |
33 |
< |
4 |
IDENT(标识符) |
34 |
== |
5 |
if |
35 |
= |
6 |
else |
36 |
!= |