编译原理:简单词法分析器的设计与实现

一、实验目的:

设计、编制并调试一个简单的c语言词法分析程序,加深对词法分析原理的理解

二、实验要求:

  1. 对单词的构词规则有明确的定义;
  2. 编写的分析程序能够正确识别源程序中的单词符号;
  3. 识别出的单词以(单词符号,种别码)的形式保存在符号表中。

三、实验内容:

词法分析中的输入为一个C语言程序文件,该文件由如下关键字、运算符、界限符、常量、标识符中的符号构成,将该程序经词法分析后,形成的单词序列,并保存在一个文本文件(.txt)中。

  1. 单词的种类及组成
    (1)关键字
    if else while do for main return int float double char
    所有的关键字都是小写。
    (2)运算符
    = + - * / % < <= > >= != = =
    (3)界限符
    ; ( ) { }
    (4)常量
    无符号整形常量,通过以下正规式定义:
    dight dight*
    (5)标识符(ID),通过以下正规式定义:
    letter (letter | digit)*
    (6)空格有空白、制表符和换行符组成。空格一般用来分隔标识符、整数、运算符、界符和关键字,词法分析阶段被忽略。

  2. 各种单词符号对应的类别码

在这里插入图片描述
在这里插入图片描述
四、数据结构设计
主要是定义字符串和数组来保存关键字,种类码和运算符、界限符等信息。
在这里插入图片描述

函数设置:
1.分析器
在这里插入图片描述
2.
在这里插入图片描述

3.数字

在这里插入图片描述

4.单词识别
在这里插入图片描述

5.判断字符是什么类型
在这里插入图片描述

五、算法流程

在这里插入图片描述

六、算法结果

输入包含c语言程序的路径,结果保存至output.txt文件当中。
1.输入文件11.txt
在这里插入图片描述

2.output.txt保存分析结果
在这里插入图片描述
在这里插入图片描述

七、实验总结

通过这次实验我学习了简单词法分析器的基本原理,知道如何去设计一个简单的词法分析器。实验总体来说难度不大,代码量也是适中的,但是难点可能在于数据结构的设置以及编码的思路。关于数据结构我也只是使用了最简单的数组来保存需要用到的参数信息,事实上真正的词法分析器,计算机词法分析的源代码要远远复杂的多,同时其数据结构的定义也十分的考究,所以一个好的数据结构的定义对一个复杂、庞大的代码来说是十分重要的。
在实验中我也遇到一些问题,比如说用c语言对文件的处理不是特别熟悉,但是这也是十分简单的,找找资料也很容易实现。
同时也十分感谢老师的讲解,在老师的讲解之下我才能了解词法分析,掌握其基本原理,从而顺利的完成实验任务。

八、实验代码

#include<stdio.h>
#include<string.h>
#include<stdlib.h>
#include <iostream>
using namespace std;

//关键字
string key[11]={"int","float","double","char","main","if","else","while","do","for","return"};
//种别码
int keyNum[11]={27,28,29,30,1,2,3,4,5,6,7};
//运算符和界符
string symbol[17]={"+","-","*","/","%",">",">=","<","<=","==","!=","=",";","(",")","{","}"};
//运算符和界符种别码
int symbolNum[17]={10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26};

//从文件取出的字符
string letter[1000];
//将字符转换为单词
string  words[1000];
int length;  //保存程序中字符的长度
int num;

//判断是否为关键字,是返回种别码
int isKeyWord(string s){
    int i;
    for(i=0;i<11;i++){
        if(s==key[i])
            return keyNum[i];
    }
    return 0;
}

int isSymbol(string s){ //判断运算符和界符
    int i;
    for(i=0;i<17;i++){
        if(s==symbol[i])
            return symbolNum[i];
    }
    return 0;
}

//判断是否为数字
bool isNumber(string s){
    if(s>="0" && s<="9")
        return true;
    return false;
}

//判断是否为字母
bool isLetter(string s)
{
    if(s>="a" && s<="z")
        return true;
    return false;
}

//返回单个字符的类型
int typeword(string str){
    if(str>="a" && str<="z")   //   字母
        return 1;

    if(str>="0" && str<="9")   //数字
        return 2;

    if(str==">"||str=="="||str=="<"||str=="!"||str==","||str==";"||str=="("||str==")"||str=="{"||str=="}"
        ||str=="+"||str=="-"||str=="*"||str=="/")   //判断运算符和界符
        return 3;

}

string identifier(string s,int n){
    int j=n+1;
    int flag=1;

    while(flag){
        if(isNumber(letter[j]) || isLetter(letter[j])){
            s=(s+letter[j]).c_str();
            if(isKeyWord(s)){
                j++;
                num=j;
                return s;
            }
            j++;
        }
        else{
            flag=0;
        }
    }

    num=j;
    return s;
}

string symbolStr(string s,int n){
    int j=n+1;
    string str=letter[j];
    if(str==">"||str=="="||str=="<"||str=="!") {
        s=(s+letter[j]).c_str();
        j++;
    }
    num=j;
    return s;
}

string Number(string s,int n){
    int j=n+1;
    int flag=1;

    while(flag){
        if(isNumber(letter[j])){
            s=(s+letter[j]).c_str();
            j++;
        }
        else{
            flag=0;
        }
    }

    num=j;
    return s;
}

void print(string s,int n){
    cout<<"<"<<s<<","<<n<<">"<<endl;
}

void recognizeWord(){  //识别单词
    int k;

    for(num=0;num<length;){
        string str,ss;
        str=letter[num];
        k=typeword(str);
        switch(k){
            case 1:
                {
                    ss=identifier(str,num);
                    if(isKeyWord(ss))
                        print(ss,isKeyWord(ss));
                    else
                        print(ss,8);
                    break;
                }

            case 2:
                {
                    ss=Number(str,num);
                    print(ss,9);
                    break;
                }

            case 3:
                {
                    ss=symbolStr(str,num);
                    print(ss,isSymbol(ss));
                    break;
                }

        }

    }
}

int main(){
    char w;
    freopen("e:\\11.txt","r",stdin); //控制台输入
    freopen("e:\\result.txt","w",stdout); //控制台输出

    length=0;
    while(cin>>w){
        if(w!=' '){
            letter[length]=w;
            length++;
        }   //去掉程序中的空格
    }
    recognizeWord();
    fclose(stdin);//关闭文件
    fclose(stdout);//关闭文件
    return 0;
}

词法分析 一、实验目的: 通过设计编制调试一个具体的词法分析程序,加深对词法分析原理的理解。并掌握在对程序设计语言源程序进行扫描过程中将其分解为各类单词的词法分析方法。 编制一个读单词过程,从输入的源程序中,识别出各个具有独立意义的单词,即基本保留字、标识符、常数、运算符、分隔符五大类。并依次输出各个单词的内部编码及单词符号自身值。(遇到错误时可显示“Error”,然后跳过错误部分继续显示) 二、实验说明 1、 词法分析器的功能和输出格式 词法分析器的功能是输入源程序,输出单词符号。词法分析器的单词符号常常表示成以下的二元式(单词种别码,单词符号的属性值)。本实验中,采用的是一类符号一种别码的方式。 2、 单词的BNF表示 -> ->|| |ε -> -> |ε -> + -> - -> > -> >= 三、实验要求 (一)准备: 1.阅读课本有关章节,明确语言的语法,写出基本保留字、标识符、常数、运算符、分隔符和程序例。 2.初步编制好程序。 3.准备好多组测试数据。 (二)上课上机: 将源代码拷贝到机上调试,发现错误,再修改完善。 第二次上机调试通过。 (三)程序要求: 程序输入/输出示例: 如源程序为C语言。输入如下一段: main() { int a,b; a = 10; b = a + 20; } 要求输出如下: (2,”main”) (5,”(“) (5,”)“) (5,”{“) (1,”int”) (2,”a”) (5,”,”) (2,”b”) (5,”;”) (2,”a”) (4,”=”) (3,”10”) (5,”;”) (2,”b”) (4,”=”) (2,”a”) (4,”+”) (3,”20”) (5,”;”) (5,”}“) 要求: 识别保留字:if、int、for、while、do、return、break、continue; 单词种别码为1。 其他的都识别为标识符;单词种别码为2。 常数为无符号整形数;单词种别码为3。 运算符包括:+、-、*、/、=、>、=、<=、!= ; 单词种别码为4。 分隔符包括:,、;、{、}、(、); 单词种别码为5。 以上为参考,具体可自行增删。 (四)程序思路 这里以开始定义的C语言子集的源程序作为词法分析程序的输入数据。在词法分析中,自文件头开始扫描源程序字符,一旦发现符合“单词”定义的源程序字符串时,将它翻译成固定长度的单词内部表示,并查填适当的信息表。经过词法分析后,源程序字符串(源程序的外部表示)被翻译成具有等长信息的单词串(源程序的内部表示),并产生两个表格:常数表和标识符表,它们分别包含了源程序中的所有常数和所有标识符。 0.定义部分:定义常量、变量、数据结构。 1.初始化:从文件将源程序全部输入到字符缓冲区中。 2.取单词前:去掉多余空白。 3.取单词后:去掉多余空白(可选,看着办)。 4.取单词:利用实验一的成果读出单词的每一个字符,组成单词,分析类型。(关键是如何判断取单词结束?取到的单词是什么类型的单词?)
词法分析是编译器的第一个阶段,也是最基础的一步,其主要任务是将源代码转换为一个个单词或符号,即“词法单元”,以供后续阶段使用。下面我们来介绍如何设计、编制并调试一个词法分析程序。 1. 设计词法规则 在设计词法规则时,首先需要分析所处理的编程语言的语法结构和语法规则,然后将其转化为正则表达式或有限状态自动机等形式,以识别出程序中的各个词法单元。例如,在C语言中,整型常量的正则表达式为`[1-9][0-9]*|0`,表示可以是以非零数字开头的整数,也可以是0。 2. 编制词法分析程序 根据所设计的词法规则,编制词法分析程序,一般有两种方式实现: (1)手写程序 手写程序可以直接使用编程语言的字符串处理函数,如`substr()`、`charAt()`等,逐个字符进行匹配,判断其是否符合所设定的正则表达式。这种方式相对简单,但是需要大量的代码量和调试工作,不适合处理复杂的语法结构。 (2)使用词法分析生成器 词法分析生成器是一种自动生成词法分析程序的工具,常用的有flex、ANTLR等。使用词法分析生成器可以大大简化程序编写过程,只需要提供所设计的词法规则,即可自动生成词法分析程序。这种方式比较适合处理复杂的语法结构,并且可以提高程序的可维护性。 3. 调试词法分析程序 在编写完词法分析程序后,需要进行调试,以确保程序的正确性。主要的调试方法包括: (1)单步调试 单步调试可以逐步执行程序,查看每一步的执行结果,以确定程序的执行过程和问题所在。在单步调试时,可以使用调试器或者打印输出等方式进行调试。 (2)测试用例 编写测试用例,验证程序的正确性。测试用例应该包含各种情况下的输入输出,包括正常情况、边界情况、异常情况等,以尽可能全面地测试程序。 总之,词法分析是编译器的重要组成部分,设计、编制并调试一个词法分析程序需要仔细分析所处理的编程语言的语法结构和语法规则,并且采用合适的方法进行实现和调试,才能保证程序的正确性和可靠性。
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值