编译原理实验一-词法分析器

一、实验目的

实验目的和要求 通过编写词法分析程序,熟悉其识别单词的基本思想及构造方法。

二、实验要求

编制一个读单词过程,从输入的源程序中,识别出各个具有独立意义的单词,即基本保留字、标识符、常数、运算符、分隔符五大类。并依次输出各个单词的内部编码、单词 符号自身值、字符类型。(遇到错误时可显示“Error”,并输出该字符,然后跳过该字符继续识别)。
(1) 标识符(变量)
ID=letter(letter|digit)*

(2) 关键字
void,main,short,long,int,double,float,while,if,else,for,break,return,char

(1) 实数
整数或小数

(2) 运算符
加减乘除 以及 < <= == > >=

(3) 分隔符

, ; ( ) { }

部分状态转换图

在这里插入图片描述

代码实现

#include <iostream>
#include <fstream>
#include <string>
#include<map>
#include <cstdio>
#include <cstdlib>
#define SIZE(a)(sizeof(a)/sizeof(a[0])) //求元素个数
using namespace std;
char op[] = {'+','-','*','/'};
void set_mp(map<int,string>&mp) {
    mp[1] = "标识符";
    mp[2] = "关键字";
    mp[3] = "运算符";
    mp[4] = "分隔符";
    mp[5] = "整数";
    mp[6] = "小数";

}
int find_k(string s){//查找s是否在保留字表keyword中
    string keyword[] = {"void","main","short","long","int","double","float","while","if","else","for","break","return","char" };//keyword表
    for (int i = 0; i < SIZE(keyword); i++) {
        if (s.compare(keyword[i]) == 0)return 1;//是保留字,返回1
    }
    return 0;//不是保留字,返回0
}

int isLimit(char c) {
    if (c == ',' || c == ';' || c == '(' || c == ')' || c == '{' || c == '}') {//识别分界符 4
            return 1;
        }
        return 0;
}

int isOp(char c) {
    int p = -1;
    for(int i = 0; i < 4; i++) {
        if(c == op[i]) p = i;
    }
    return p;
}

int main()
{
    ifstream in("input.txt");
    ofstream out("output.txt");
    string s;
    char word;
    int op_pos = -1;
    map<int,string>mp;
    set_mp(mp);
    word = in.get();

    while (!in.eof()) {
        if (isLimit(word)) {//识别分界符
            out << "<" << word << ",4,"<<mp[4]<<">\n";
            word = in.get();
        }else if (isdigit(word)) {//识别整数/实数
            s = "";
            while (isdigit(word)) {
                s += word;
                word = in.get();
                if (word == '.') {//如果出现小数点,有可能是常实数
                    s += word;
                    word = in.get();
                    if (isdigit(word)) {
                        while (isdigit(word)) {
                            s += word;
                            word = in.get();
                        }
                        out << "<" << s << ",6,"<<mp[6]<<">\n";//常实数
                        break;
                    }
                    else out << s + " is error!\n";//如果小数点后没有数字,则报错
                }
                if (!isdigit(word)) {
                    out << "<" << s << ",5,"<<mp[5]<<">\n";//常整数
                    break;
                }
            }
        }else if (isalpha(word) || word == '_') {//识别标识符/保留字
            s = "";
            while (isalpha(word) || isdigit(word) || word =='_') {
                s += word;
                word = in.get();
            }
            if (find_k(s)) {//在keyword表中查找s是否是保留字
                out << "<" << s << ",2,"<<mp[2]<<">\n";//保留字
            }
            else out << "<" << s << ",1,"<<mp[1]<<">\n";//标识符
        }else if (word == '>') {//后面都是运算符
            s = "";
            s += word;
            word = in.get();
            if (word == '=') {//">="
                s += word;
                word = in.get();
            }
            out << "<" << s << ",3,"<<mp[3]<<">\n";
        }
        else if (word == '<') {
            s = "";
            s += word;
            word = in.get();
            if (word == '=') {//"<="
                s += word;
                word = in.get();
            }
            out << "<" << s << ",3,"<<mp[3]<<">\n";
        }else if (word == '=') {
            s = "";
            s += word;
            word = in.get();
            if (word == '=') {//"=="
                s += word;
                word = in.get();
            }
            out << "<" << s << ",3,"<<mp[3]<<">\n";
        }else if((op_pos = isOp(word)) != -1) {
            out << "<" << word << ",3,"<<mp[3]<<">\n";
            word = in.get();
        }else {//跳过当前单词
            word = in.get();
        }
    }
    return 0;
}

测试数据

int main()
{
   int i,ans;
   char c;
   scan c;
   double b=1.5;
   float f;
   for(i=0;i<5;i=i+1)
   {
       ans=ans+1;
   }
   print ans;
   return 0;
}

输出结果

<int,2,关键字>
<main,2,关键字>
<(,4,分隔符>
<),4,分隔符>
<{,4,分隔符>
<int,2,关键字>
<i,1,标识符>
<,,4,分隔符>
<ans,1,标识符>
<;,4,分隔符>
<char,2,关键字>
<c,1,标识符>
<;,4,分隔符>
<scan,1,标识符>
<c,1,标识符>
<;,4,分隔符>
<double,2,关键字>
<b,1,标识符>
<=,3,运算符>
<1.5,6,小数>
<;,4,分隔符>
<float,2,关键字>
<f,1,标识符>
<;,4,分隔符>
<for,2,关键字>
<(,4,分隔符>
<i,1,标识符>
<=,3,运算符>
<0,5,整数>
<;,4,分隔符>
<i,1,标识符>
<<,3,运算符>
<5,5,整数>
<;,4,分隔符>
<i,1,标识符>
<=,3,运算符>
<i,1,标识符>
<1,5,整数>
<),4,分隔符>
<{,4,分隔符>
<ans,1,标识符>
<=,3,运算符>
<ans,1,标识符>
<1,5,整数>
<;,4,分隔符>
<},4,分隔符>
<print,1,标识符>
<ans,1,标识符>
<;,4,分隔符>
<return,2,关键字>
<0,5,整数>
<;,4,分隔符>
<},4,分隔符>

实验一:词法分析 一、实验目的 通过设计一个具体的词法分析程序,加深对词法分析原理的理解。并掌握在对程序设计语言源程序进行扫描过程将其分解为各类单词的词法分析方法。 编制一个单词过程,从输入源程序识别各个具有独立意义单词,即基本保留字、标识符、常数、运算符、分隔符五大类。并依次输各个单词的内部编码及单词符号自身值。 二、实验预习提示 1、 词法分析器的功能和输格式 词法分析器的功能是输入源程序,输单词符号。词法分析器单词符号常常表示成以下的二元式(单词种别码,单词符号的属性值)。本实验,采用的是一类符号对应一个种别码的方式。 2、 单词的BNF表示 ----> ----> ----> + ----> - 等等 3、 模块结构(见课本P95-96)(可根据自己的理解适当修改) 三、实验过程和指导: (一) 准备: 1. 阅课本有关章节,明确语言的语法,写基本保留字、标识符、常数、运算符、分隔符和程序例。 2. 初步编制好程序。 3. 准备好多组测试数据。 (二) 上机: (三) 程序要求: 1. 要求用C++Builder或者Dephi或者VC、VB等可视化编程工具编写;要求有界面(即一般windows下应用程序界面)。 2. 输入为某语言源代码。 程序输入/输示例: 如源程序C语言输入如下一段: main() { int a,b; a=10; b=a+20; } 要求输如下(并以文件形式输)。 (2,”main”) (5,”(“) (5,”)“) (5,”{“} (1,”int”) (2,”a”) (5,”,”) (2,”b”) (5,”;”) (2,”a”) (4,”=”) (3,”10”) (5,”;”) (2,”b”) (4,”=”) (2,”a”) (4,”+”) (3,”20”) (5,”;”) (5,”}“) 注:为右大括号 要求(可根据实际情况加以扩充和修改): 识别保留字:if、int、for、while、do、return、break、continue等等,单词种别码为1。 其他的标识符,单词种别码为2。 常数为无符号数,单词种别码为3。 运算符包括:+、-、*、/、=、>、=、<=、!= ;单词种别码为4。 分隔符包括: “,”“;”“(”“)”“{”“}”等等, 单词种别码为5。 (四) 程序思路(仅供参考): 0. 定义部分:定义常量、变量、数据结构。 1. 初始化:从文件将源程序输入到字符缓冲区。 2. 取单词前:去掉多余空白。调用过程GETNB(); 3. 提取字符组成单词,利用课本P97图4.5转换图构造单词扫描过程SCAN(),需要根据实际情况加以修改。 4. 判断单词的种别码,调用过程LOOKUP(); 5. 显示(导)结果。
一、实验目的: 通过设计编制调试一个具体的词法分析程序,加深对词法分析原理的理解。并掌握在对程序设计语言源程序进行扫描过程将其分解为各类单词的词法分析方法。 编制一个单词过程,从输入源程序识别各个具有独立意义单词,即基本保留字、标识符、常数、运算符、分隔符五大类。并依次输各个单词的内部编码及单词符号自身值。(遇到错误时可显示“Error”,然后跳过错误部分继续显示) 二、实验预习提示 1、词法分析器的功能和输格式 词法分析器的功能是输入源程序,输单词符号。词法分析器单词符号常常表示成以下的二元式(单词种别码,单词符号的属性值)。本实验,采用的是按类来安排种别码的方式。 2、部分单词的BNF表示(可参考教材43页的状态转换图) -> ->|| |ε -> -> |ε -> + -> - -> > -> >= 3、 做词法分析器需要把对象语言的词法全部描述来,在这我们取C语言子集,它的词法如下: (1)关键字 main if else int return void while…….. 所有的关键字都是小写。 (2)专用符号 = + - * / <= > >= == != ; : , { } [ ] ( ) (3)空格和空白、制表符和换行符。 空格一般用来分隔ID、NUM、专用符号和关键字,在词法分析阶段通常被忽略。 各种单词符号的种别码,这是一种符号一个编码的设计。只供参考! 单词符号 种别码 单词符号 种别码 main 2 [ 28 int 1 ] 29 char 3 { 30 If 4 } 31 else 5 , 32 for 6 : 33 while 7 ; 34 ID 10 > 35 NUM 20 = 37 + 22 +”,当前字符为’>’,此时,分析器倒底是将其分析为大于关系运算符还是大于等于关系运算符呢?显然,只有知道下一个字符是什么才能下结论。于是分析器入下一个字符’+’,这时可知应将’>’解释为大于运算符。但此时,超前一个字符’+’,所以要回退一个字符,词法分析器才能正常运行。在分析标识符,无符号整数等时也有类似情况。 5、模块结构 见附图 三、实验过程和指导: (一)准备: 1.阅课本有关章节,明确语言的语法,写基本保留字、标识符、常数、运算符、分隔符和程序例。 2.编制好程序。 3.准备好多组测试数据。 (二)上机调试: (三)程序要求: 程序输入/输示例: 如源程序C语言输入如下一段: main() { int a,b; a = 10; b = a + 20; } 要求输如右图。 (2,“main”) (5,“(” ) (5,“ )” ) (5,“{ ” ) (1,“int” ) (2,“a” ) (5,“,” ) (2,“b” ) (5,“;” ) (2,“a” ) (4,“=” ) (3,“10” ) (5,“;” ) (2,“b” ) (4,“=” ) (2,“a” ) (4,“+” ) (3,“20” ) (5,“;” ) (5,“}” ) 说明: 识别保留字:if、int、for、while、do、return、break、continue; 单词种别码为1。 其他的都识别为标识符;单词种别码为2。 常数为无符号整形数;单词种别码为3。 运算符包括:+、-、*、/、=、>、=、<=、!= ;单词种别码为4。 分隔符包括:,、;、{、}、(、); 单词种别码为5。 以上为参考,具体可自行增删。 程序思路(参考): 这里以开始定义的C语言子集的源程序作为词法分析程序的输入数据。在词法分析,自文件头开始扫描源程序字符,一旦发现符合“单词”定义的源程序字符串时,将它翻译成固定长度的单词内部表示,并查填适当的信息表。 经过词法分析后,源程序字符串源程序的外部表示)被翻译成具有等长信息的单词串(源程序的内部表示),并产生两个表格:常数表和标识符表,它们分别包含了源程序的所有常数和所有标识符。 0.定义部分:定义常量、变量、数据结构。 1.初始化:从文件将源程序全部输入到字符缓冲区。 2.取单词前:去掉多余空白。 3.取单词后:去掉多余空白(可选,看着办)。 4.取单词:利用实验一的成果单词的每一个字符,组成单词,分析类型。(关键是如何判断取单词结束?取到的单词是什么类型的单词?) 5.显示结果。 为了设计好程序,注意以下事情: 1.模块设计:将程序分成合理的多个模块(函数),每个模块做具体的同一事情。 2.写(画)设计方案:模块关系简图、流程图、全局变量、函数接口等。 3.编程时注意编程风格:空行的使用、注释的使用、缩进的使用等。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值