词法分析器
代码在最后
-
要求
该词法分析器能够读入使用PL/0语言书写的源程序,输出单词符号串及其属性到一中间文件中,具有一定的错误处理能力,给出词法错误提示(需要输出错误所在的行列)。
-
效果展示
报错有非法字符、表示符不能以数字加字母的形式、“:=”超前搜索不能只是“:“。报错显示某行某列。
-
测试文本1.txt 生成的是2.txt
4.文件
1.txt 用于分析
》var 58m, n, r, q;
procedure gcd;
begin(9)
while r>=0 do
begin
q := m / n;
r : m - q * n;
m := n;
n := r;
end;
end;
begin
read(m);
read(n);
if_5_ m < n then
begin
r := m;
m := n;
n := r;
end;
begin
r:=1;
call gcd;
write(m);
end;
end;
cpp文件
#include<iostream>
#include<fstream>
#include<string.h>
using namespace std;
string Concat(char ch,string &strToken)
{
strToken += ch;
return strToken;
}
int isLetter(char ch)
{
if((ch>='A'&&ch<='Z')||(ch>='a'&&ch<='z'))
return true;
else
return false;
}
int isDigit(char ch)
{
if(ch>='0'&&ch<='9')
return true;
else
return false;
}
int Reserve(string &strToken,string *table)
{
int i=1;
for(i;i<30;i++)
{
if(strToken==table[i])
{
return i;
}
}
if(i==30)
{
return 0;//不是保留字,是标识符
}
else
{
return 1;
}
}
int InsertId(string &strToken,string *table)//插入标识符
{
int i;
for(i=1;i<30;i++)
{
if(table[i]=="")
{
table[i]=strToken;
break;
}
}
return i;
}
int InsertConst(string &strToken,int *table)//插入常数
{
int i;
for(i=0;i<30;i++)
{
if(table[i]==-999999)
{
table[i]=atoi(strToken.c_str());
break;
}
}
table[i+1]=-999999;
return i;
}
int main()
{
string sign_table[30]={"","program","const","var","procedure","begin","end","if","while","do","call","read","write","odd","then"};
int digi_table[30];
int row=1,col=0;
digi_table[0]=-999999;
ifstream srcFile("D:\\Cprogram\\bianyiyuanlishangji\\P0\\1.txt"); //打开1.txt
if(!srcFile)
{ //打开失败
cout << "error opening source file." << endl;
return 0;
}
ofstream ofile("D:\\Cprogram\\bianyiyuanlishangji\\P0\\2.txt");
if(!ofile)
{ //打开失败
cout << "error opening source file." << endl;
return 0;
}
char ch;
string strToken="";
int total=0,code,value;
ch=srcFile.get();
col++;
while(!srcFile.eof())
{
strToken="";
if(isLetter(ch))
{
while (isLetter(ch) || isDigit(ch) )
{
Concat(ch,strToken);
// ofile<<"strToken: "<<strToken<<endl;
ch=srcFile.get();
col++;
}
// srcFile.seekg(-1, ios::cur);
// ofile<<"退后一个之后ch:"<<ch<<endl;
code = Reserve(strToken, sign_table);
if(code==0)
{
value=InsertId(strToken, sign_table);
ofile<<"<id,指向"<<strToken<<"的符号表项的指针,序号为"<<value<<">"<<endl;//ID
}
else//保留字
{
if(code==1)
{
ofile<<"<program,->"<<endl;
}
else if(code==2)
{
ofile<<"<const,->"<<endl;
}
else if(code==3)
{
ofile<<"<var,->"<<endl;
}
else if(code==4)
{
ofile<<"<procedure,->"<<endl;
}
else if(code==5)
{
ofile<<"<begin,->"<<endl;
}
else if(code==6)
{
ofile<<"<end,->"<<endl;
}
else if(code==7)
{
ofile<<"<if,->"<<endl;
if(ch!=' ')
{
cout<<row<<"行"<<col<<"列: ";
cout<<"error,标识符非法"<<endl;
}
}
else if(code==8)
{
ofile<<"<while,->"<<endl;
}
else if(code==9)
{
ofile<<"<do,->"<<endl;
}
else if(code==10)
{
ofile<<"<call,->"<<endl;
}
else if(code==11)
{
ofile<<"<read,->"<<endl;
}
else if(code==12)
{
ofile<<"<write,->"<<endl;
}
else if(code==13)
{
ofile<<"<odd,->"<<endl;
}
else if(code==14)
{
ofile<<"<then,->"<<endl;
}
else{
ofile<<"<已经定义的标识符:"<<sign_table[code]<<">"<<endl;
}
}
}
else if(isDigit(ch))
{
while(isDigit(ch))
{
Concat(ch,strToken);
ch=srcFile.get();
col++;
}
// srcFile.seekg(-1, ios::cur);
if(isLetter(ch))
{
cout<<row<<"行"<<col<<"列: ";
cout<<"error,标识符不能以数字开头"<<endl;
}
else
{
value = InsertConst(strToken, digi_table);
ofile<<"<integer,数值为"<<strToken<<",序号为"<<value<<">"<<endl;
}
}
else if(ch=='=')
{
ofile<<"<=,-><lop>"<<endl;ch=srcFile.get();
col++;
}
else if(ch=='<')
{
ch=srcFile.get();
col++;
if(ch=='>')
{
ofile<<"<<>,-><lop>"<<endl;ch=srcFile.get();
col++;
}
else if(ch=='=')
{
ofile<<"<<=,-><lop>"<<endl;ch=srcFile.get();
col++;
}
else
{
ofile<<"<<,-><lop>"<<endl;
// srcFile.seekg(-1, ios::cur);
}
}
else if(ch=='>')
{
ch=srcFile.get();
col++;
if(ch=='=')
{
ofile<<"<>=,-><lop>"<<endl;ch=srcFile.get();
col++;
}
else
{
ofile<<"<<,-><lop>"<<endl;
// srcFile.seekg(-1L, ios::cur);
}
}
else if(ch=='+')
{
ofile<<"<+,-><aop>"<<endl;ch=srcFile.get();
col++;
}
else if(ch=='-')
{
ofile<<"<-,-><aop>"<<endl;ch=srcFile.get();
col++;
}
else if(ch=='*')
{
ofile<<"<*,-><mop>"<<endl;ch=srcFile.get();
col++;
}
else if(ch=='/')
{
ofile<<"</,-><mop>"<<endl;ch=srcFile.get();
col++;
}
else if(ch==':')
{
ch=srcFile.get();
col++;
if(ch=='=')
{
ofile<<"<:=,->"<<endl;ch=srcFile.get();
col++;
}
else
{
cout<<row<<"行"<<col<<"列: ";
cout<<"error,:后面缺少="<<endl;
// srcFile.seekg(-1L, ios::cur);
}
}
else if (ch==';')
{
ofile<<"<;,->"<<endl;ch=srcFile.get();
col++;
}
else if (ch==',')
{
ofile<<"<,,->"<<endl;ch=srcFile.get();
col++;
}
else if(ch==' '||ch=='\n')
{
if(ch=='\n')
{
row++;col=0;
}
ch=srcFile.get();
col++;
}
else if (ch=='(')
{
ofile<<"<(,->"<<endl;ch=srcFile.get();
col++;
}
else if (ch==')')
{
ofile<<"<),->"<<endl;ch=srcFile.get();
col++;
}
else
{
cout<<row<<"行"<<col<<"列: ";
cout<<"error,输入错误: \t"<<ch<<endl;ch=srcFile.get();
col++;
}
}
srcFile.close();
ofile.close();
system("pause");
}