编译原理---词法分析器

词法分析器

代码在最后

  1. 要求
    该词法分析器能够读入使用PL/0语言书写的源程序,输出单词符号串及其属性到一中间文件中,具有一定的错误处理能力,给出词法错误提示(需要输出错误所在的行列)。
    在这里插入图片描述

  2. 效果展示
    报错有非法字符、表示符不能以数字加字母的形式、“:=”超前搜索不能只是“:“。报错显示某行某列。
    在这里插入图片描述

  3. 测试文本1.txt 生成的是2.txt

在这里插入图片描述

4.文件
1.txt 用于分析

》var 58m, n, r, q;
procedure gcd;
begin(9)
while r>=0 do
begin
q := m / n;
r : m - q * n;
m := n;
n := r;
end;
end;
begin
read(m);
read(n);
if_5_ m < n then
begin
r := m;
m := n;
n := r;
end;
begin
r:=1;
call gcd;
write(m);
end;
end;

cpp文件

#include<iostream>
#include<fstream>
#include<string.h>
using namespace std;
string Concat(char ch,string &strToken)
{
    strToken += ch;
    return strToken;
}
int isLetter(char ch)
{
    if((ch>='A'&&ch<='Z')||(ch>='a'&&ch<='z'))
        return true;
    else
        return false; 
}
int isDigit(char ch)
{
    if(ch>='0'&&ch<='9')
        return true;
    else
        return false; 
}
int Reserve(string &strToken,string *table)
{
    int i=1;
    for(i;i<30;i++)
    {
        if(strToken==table[i])
        {
            return i;
        }
    }
    if(i==30)
    {
        return 0;//不是保留字,是标识符
    }
    else
    {
        return 1;
    }
}

int InsertId(string &strToken,string *table)//插入标识符
{
    int i;
    for(i=1;i<30;i++)
    {
        if(table[i]=="")
        {
            table[i]=strToken;
            break;
        }
    }
    return i;
}
int InsertConst(string &strToken,int *table)//插入常数
{
    int i;
    for(i=0;i<30;i++)
    {
        if(table[i]==-999999)
        {
            table[i]=atoi(strToken.c_str());
            break;
        }
    }
    table[i+1]=-999999;
    return i;
}
int main()
{
    string sign_table[30]={"","program","const","var","procedure","begin","end","if","while","do","call","read","write","odd","then"};
    int digi_table[30];
    int row=1,col=0;
    digi_table[0]=-999999;
    ifstream srcFile("D:\\Cprogram\\bianyiyuanlishangji\\P0\\1.txt"); //打开1.txt
    if(!srcFile)
    { //打开失败
        cout << "error opening source file." << endl;
        return 0;
    }
    ofstream ofile("D:\\Cprogram\\bianyiyuanlishangji\\P0\\2.txt");
    if(!ofile)
    { //打开失败
        cout << "error opening source file." << endl;
        return 0;
    }
    char ch;
    string strToken="";
    int total=0,code,value;
    ch=srcFile.get();
    col++;
    while(!srcFile.eof())
    {
        strToken="";
        if(isLetter(ch))
        {
            while (isLetter(ch) || isDigit(ch) )
            {
                Concat(ch,strToken);
                // ofile<<"strToken: "<<strToken<<endl;
                ch=srcFile.get();
                col++;
            }
            // srcFile.seekg(-1, ios::cur);
            // ofile<<"退后一个之后ch:"<<ch<<endl;
            code = Reserve(strToken, sign_table);
            if(code==0)
            {
                value=InsertId(strToken, sign_table);
                ofile<<"<id,指向"<<strToken<<"的符号表项的指针,序号为"<<value<<">"<<endl;//ID
            }
            else//保留字
            {
                if(code==1)
                {
                    ofile<<"<program,->"<<endl;
                }
                else if(code==2)
                {
                    ofile<<"<const,->"<<endl;
                }
                else if(code==3)
                {
                    ofile<<"<var,->"<<endl;
                }
                else if(code==4)
                {
                    ofile<<"<procedure,->"<<endl;
                }
                else if(code==5)
                {
                    ofile<<"<begin,->"<<endl;
                }
                else if(code==6)
                {
                    ofile<<"<end,->"<<endl;
                }
                else if(code==7)
                {
                    ofile<<"<if,->"<<endl;
                    if(ch!=' ')
                    {
                        cout<<row<<"行"<<col<<"列: ";
                        cout<<"error,标识符非法"<<endl;
                    }
                }
                else if(code==8)
                {
                    ofile<<"<while,->"<<endl;
                }
                else if(code==9)
                {
                    ofile<<"<do,->"<<endl;
                }
                else if(code==10)
                {
                    ofile<<"<call,->"<<endl;
                }
                else if(code==11)
                {
                    ofile<<"<read,->"<<endl;
                }
                else if(code==12)
                {
                    ofile<<"<write,->"<<endl;
                }
                else if(code==13)
                {
                    ofile<<"<odd,->"<<endl;
                }
                else if(code==14)
                {
                    ofile<<"<then,->"<<endl;
                }
                else{
                    ofile<<"<已经定义的标识符:"<<sign_table[code]<<">"<<endl;
                }
            }
        }
        else if(isDigit(ch))
        {
            while(isDigit(ch))
            {
                Concat(ch,strToken);
                ch=srcFile.get();
                col++;
            }
            // srcFile.seekg(-1, ios::cur);
            
            if(isLetter(ch))
            {
                cout<<row<<"行"<<col<<"列: ";
                cout<<"error,标识符不能以数字开头"<<endl;
            }
            else
            {
                value = InsertConst(strToken, digi_table);
                ofile<<"<integer,数值为"<<strToken<<",序号为"<<value<<">"<<endl;
            }
        }
        else if(ch=='=')
        {
            ofile<<"<=,-><lop>"<<endl;ch=srcFile.get();
            col++;
        }
        else if(ch=='<')
        {
            ch=srcFile.get();
            col++;
            if(ch=='>')
            {
                ofile<<"<<>,-><lop>"<<endl;ch=srcFile.get();
                col++;
            }
            else if(ch=='=')
            {
                ofile<<"<<=,-><lop>"<<endl;ch=srcFile.get();
                col++;
            }
            else
            {
                ofile<<"<<,-><lop>"<<endl;
               // srcFile.seekg(-1, ios::cur);
            }
        }
        else if(ch=='>')
        {
            ch=srcFile.get();
            col++;
            if(ch=='=')
            {
                ofile<<"<>=,-><lop>"<<endl;ch=srcFile.get();
                col++;
            }
            else
            {
                ofile<<"<<,-><lop>"<<endl;
                // srcFile.seekg(-1L, ios::cur);
            }
        }
        else if(ch=='+')
        {
            ofile<<"<+,-><aop>"<<endl;ch=srcFile.get();
            col++;
        }
        else if(ch=='-')
        {
            ofile<<"<-,-><aop>"<<endl;ch=srcFile.get();
            col++;
        }
        else if(ch=='*')
        {
            ofile<<"<*,-><mop>"<<endl;ch=srcFile.get();
            col++;
        }
        else if(ch=='/')
        {
            ofile<<"</,-><mop>"<<endl;ch=srcFile.get();
            col++;
        }
        else if(ch==':')
        {
            ch=srcFile.get();
            col++;
            if(ch=='=')
            {
                ofile<<"<:=,->"<<endl;ch=srcFile.get();
                col++;
            }
            else
            {
                cout<<row<<"行"<<col<<"列: ";
                cout<<"error,:后面缺少="<<endl;
                // srcFile.seekg(-1L, ios::cur);
            }
        }
        else if (ch==';')
        {
            ofile<<"<;,->"<<endl;ch=srcFile.get();
            col++;
        }
        else if (ch==',')
        {
            ofile<<"<,,->"<<endl;ch=srcFile.get();
            col++;
        }
        else if(ch==' '||ch=='\n')
        {
            if(ch=='\n')
            {
                row++;col=0;
            }
            ch=srcFile.get();
            col++;
        }
        else if (ch=='(')
        {
            ofile<<"<(,->"<<endl;ch=srcFile.get();
            col++;
        }
        else if (ch==')')
        {
            ofile<<"<),->"<<endl;ch=srcFile.get();
            col++;
        }
        else
        {
            cout<<row<<"行"<<col<<"列: ";
            cout<<"error,输入错误: \t"<<ch<<endl;ch=srcFile.get();
            col++;
        }
    }
    srcFile.close();
    ofile.close();
    system("pause");
}
词法分析 一、实验目的: 通过设计编制调试一个具体的词法分析程序,加深对词法分析原理的理解。并掌握在对程序设计语言源程序进行扫描过程中将其分解为各类单词的词法分析方法。 编制一个读单词过程,从输入的源程序中,识别出各个具有独立意义的单词,即基本保留字、标识符、常数、运算符、分隔符五大类。并依次输出各个单词的内部编码及单词符号自身值。(遇到错误时可显示“Error”,然后跳过错误部分继续显示) 二、实验说明 1、 词法分析器的功能和输出格式 词法分析器的功能是输入源程序,输出单词符号。词法分析器的单词符号常常表示成以下的二元式(单词种别码,单词符号的属性值)。本实验中,采用的是一类符号一种别码的方式。 2、 单词的BNF表示 -> ->|| |ε -> -> |ε -> + -> - -> > -> >= 三、实验要求 (一)准备: 1.阅读课本有关章节,明确语言的语法,写出基本保留字、标识符、常数、运算符、分隔符和程序例。 2.初步编制好程序。 3.准备好多组测试数据。 (二)上课上机: 将源代码拷贝到机上调试,发现错误,再修改完善。 第二次上机调试通过。 (三)程序要求: 程序输入/输出示例: 如源程序为C语言。输入如下一段: main() { int a,b; a = 10; b = a + 20; } 要求输出如下: (2,”main”) (5,”(“) (5,”)“) (5,”{“) (1,”int”) (2,”a”) (5,”,”) (2,”b”) (5,”;”) (2,”a”) (4,”=”) (3,”10”) (5,”;”) (2,”b”) (4,”=”) (2,”a”) (4,”+”) (3,”20”) (5,”;”) (5,”}“) 要求: 识别保留字:if、int、for、while、do、return、break、continue; 单词种别码为1。 其他的都识别为标识符;单词种别码为2。 常数为无符号整形数;单词种别码为3。 运算符包括:+、-、*、/、=、>、=、<=、!= ; 单词种别码为4。 分隔符包括:,、;、{、}、(、); 单词种别码为5。 以上为参考,具体可自行增删。 (四)程序思路 这里以开始定义的C语言子集的源程序作为词法分析程序的输入数据。在词法分析中,自文件头开始扫描源程序字符,一旦发现符合“单词”定义的源程序字符串时,将它翻译成固定长度的单词内部表示,并查填适当的信息表。经过词法分析后,源程序字符串(源程序的外部表示)被翻译成具有等长信息的单词串(源程序的内部表示),并产生两个表格:常数表和标识符表,它们分别包含了源程序中的所有常数和所有标识符。 0.定义部分:定义常量、变量、数据结构。 1.初始化:从文件将源程序全部输入到字符缓冲区中。 2.取单词前:去掉多余空白。 3.取单词后:去掉多余空白(可选,看着办)。 4.取单词:利用实验一的成果读出单词的每一个字符,组成单词,分析类型。(关键是如何判断取单词结束?取到的单词是什么类型的单词?)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值