编译原理——词法分析器

       输入为字符串(或待进行词法分析的源程序),输出为单词串,即由(单词,类别)所组成的二元组序列;

有一定的错误检查能力,例如能发现2a这类不能作为单词的字符串。

       保留字表没有做全,用时自行添加即可。


C++实现如下:

#include<fstream>
#include<cstring>
#include<string>
#include<fstream>
#include<sstream>
#include<iostream>
#include<map>
#include<bits/stdc++.h>
using namespace std;
map<string,string> word;//保留字表 
std::map<string,string>::iterator it;//查找保留字的迭代器
void map_init(){//对应关系进行初始化
	word["for"]="保留字";
	word["else"]="保留字";
	word["const"]="保留字";
	word["do"]="保留字";
	word["endl"]="保留字";
	word["if"]="保留字";
	word["cout"]="保留字";
	word["void"]="保留字";
	word["read"]="保留字";
	word["then"]="保留字";
	word["cin"]="保留字";
	word["while"]="保留字";
	word["break"]="保留字";
	word["int"]="保留字";
	word["double"]="保留字";
	word["float"]="保留字";
	word["long"]="保留字";
	word["main"]="保留字";
	word["continue"]="保留字";
	word["return"]="保留字";
	word["bool"]="保留字";
	word["string"]="保留字";
	word["getline"]="保留字";
	word["true"]="保留字";
	word["false"]="保留字";
	word["+"]="运算符";
	word["-"]="运算符";
	word["*"]="运算符";
	word["/"]="运算符";
	word["="]="运算符";
	word["<"]="运算符";
	word["<="]="运算符";
	word["<<"]="运算符";
	word[">>"]="运算符";
	word[">"]="运算符";
	word["%"]="运算符";
	word[">="]="运算符";
	word["=="]="运算符";
	word["!="]="运算符";
	word["|"]="运算符";
	word["||"]="运算符";
	word["&"]="运算符";
	word["&&"]="运算符";
	word["("]="界符";
	word[")"]="界符";
	word[","]="分隔符";
	word[";"]="界符";
	word["."]="运算符";
	word["->"]="运算符";
	word["["]="界符";
	word["]"]="界符";
	word["{"]="界符";
	word["}"]="界符";
	word["}"]="界符";
	word["'"]="界符";
}
int main(){
	map_init();		//初始化
	char ch;
	char a;
	string word1;		//识别单词
	string str;		//字符识别
	ifstream infile("E:\\编译原理\\ans.txt");	//源程序文件路径输入 
	ostringstream buf;
	while(buf&&infile.get(ch)) buf.put(ch);		//将文件中的字符读出来
	str= buf.str();		//获取得到的字符
	int csize=str.length();
	for(int i=0;i<csize;i++){		//对整个字符串进行遍历
		while(str[i]==' '||str[i]=='\n'||str[i]=='	') i++;		//若最开始为空格、制表符或换行符,则将指针的位置往后移
		if(isalpha(str[i])){	//对标识符和保留字进行识别,调用库函数isalpha() 
			word1=str[i++];
			while(isalpha(str[i])||isdigit(str[i])){
				word1+=str[i++];
			}
			it=word.find(word1);
			if(it!=word.end()){		//判断是不是保留字,若为保留字则进行输出
				cout<<word1<<","<<word[word1]<<endl;
			}
			else{	//否则直接输出 
				cout<<word1<<",标识符"<<endl;
			}
			i--;
		}
		else if(isdigit(str[i])){	//判断是不是常数,调用库函数isdigit()
			word1=str[i++];
			while(isdigit(str[i])){
				word1+=str[i++];
			}
			if(isalpha(str[i])){
				while(isalpha(str[i])||isdigit(str[i])){
					word1+=str[i++];
				}
				cout<<word1<<",非法定义的标识符"<<endl;
			}
			else{
				cout<<word1<<",数字"<<endl;
			}
			i--;
		}else if(str[i]=='<'){//对<,<=,<<分别进行判断
			word1=str[i++];
			if(str[i]=='='){
				word1+=str[i];
				cout<<word1<<","<<word[word1]<<endl;
				i++;
			}else if(str[i]=='<'){
				word1+=str[i];
				cout<<word1<<","<<word[word1]<<endl;
				i++;
			}else if(str[i]!=' '||!isdigit(str[i])||!isalpha(str[i])){
				cout<<word1<<","<<word[word1]<<endl;
			}else{
				cout<<"error!"<<endl;
				break;
			}
			i--;
		}else if(str[i]=='>'){//对>,>=,>>分别进行判断
			word1=str[i++];
			if(str[i]=='='){
				word1+=str[i];
				cout<<word1<<","<<word[word1]<<endl;
				i++;
			}else if(str[i]=='>'){
				word1+=str[i];
				cout<<word1<<","<<word[word1]<<endl;
				i++;
			}else if(str[i]!=' '||!isdigit(str[i])||!isalpha(str[i])){
				cout<<word1<<","<<word[word1]<<endl;
			}else{
				cout<<"error!"<<endl;
				break;
			}
			i--;
		}else if(str[i]=='-'){//对-,->进行判断
			word1=str[i++];
			if(str[i]=='>'){
				word1+=str[i];
				cout<<word1<<","<<word[word1]<<endl;
				i++;
			}else if(str[i]!=' '||!isdigit(str[i])||!isalpha(str[i])){
				cout<<word1<<","<<word[word1]<<endl;
			}else{
				cout<<"error!"<<endl;
				break;
			}
			i--;
		}else if(str[i]=='='){//对==分别进行判断
			word1=str[i++];
			if(str[i]=='='){
				word1+=str[i];
				cout<<word1<<","<<word[word1]<<endl;
				i++;
			}else if(str[i]!=' '||!isdigit(str[i])||!isalpha(str[i])){
				cout<<word1<<","<<word[word1]<<endl;
			}else{
				cout<<"error!"<<endl;
				break;
			}
			i--;
		}else if(str[i]=='!'){//对!=分别进行判断
			word1=str[i++];
			if(str[i]=='='){
				word1+=str[i];
				cout<<word1<<","<<word[word1]<<endl;
				i++;
			}else if(str[i]!=' '||!isdigit(str[i])||!isalpha(str[i])){
				cout<<word1<<","<<word[word1]<<endl;
			}else{
				cout<<"error!"<<endl;
				break;
			}
			i--;
		}else if(str[i]=='|'){//对|,||分别进行判断
			word1=str[i++];
			if(str[i]=='|'){
				word1+=str[i];
				cout<<word1<<","<<word[word1]<<endl;
				i++;
			}else if(str[i]!=' '||!isdigit(str[i])||!isalpha(str[i])){
				cout<<word1<<","<<word[word1]<<endl;
			}else{
				cout<<"error!"<<endl;
				break;
			}
			i--;
		}else if(str[i]=='&'){//对&,&&分别进行判断
			word1=str[i++];
			if(str[i]=='&'){
				word1+=str[i];
				cout<<word1<<","<<word[word1]<<endl;
				i++;
			}else if(str[i]!=' '||!isdigit(str[i])||!isalpha(str[i])){
				cout<<word1<<","<<word[word1]<<endl;
			}else{
				cout<<"error!"<<endl;
				break;
			}
			i--;
		}else if(str[i]=='"'){//对字符串进行判断
			word1=str[i++];
			while(str[i]!='"'){
				word1+=str[i++];
			}
			word1+=str[i++];
			cout<<word1<<",字符串"<<endl;
			i--;
		}else{	//对其他的基本字依次进行判断
			word1=str[i];
			it=word.find(word1);
			if(it!=word.end()){
				cout<<word1<<","<<word[word1]<<endl;
			}else{
				cout<<"error!"<<endl;
				break;
			}
		}
	}
	infile.close();
	return 0;
}

ans.txt文件为要识别的源程序文件,将要识别的源程序放入其中即可。

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
词法分析 一、实验目的: 通过设计编制调试一个具体的词法分析程序,加深对词法分析原理的理解。并掌握在对程序设计语言源程序进行扫描过程中将其分解为各类单词的词法分析方法。 编制一个读单词过程,从输入的源程序中,识别出各个具有独立意义的单词,即基本保留字、标识符、常数、运算符、分隔符五大类。并依次输出各个单词的内部编码及单词符号自身值。(遇到错误时可显示“Error”,然后跳过错误部分继续显示) 二、实验说明 1、 词法分析器的功能和输出格式 词法分析器的功能是输入源程序,输出单词符号。词法分析器的单词符号常常表示成以下的二元式(单词种别码,单词符号的属性值)。本实验中,采用的是一类符号一种别码的方式。 2、 单词的BNF表示 -> ->|| |ε -> -> |ε -> + -> - -> > -> >= 三、实验要求 (一)准备: 1.阅读课本有关章节,明确语言的语法,写出基本保留字、标识符、常数、运算符、分隔符和程序例。 2.初步编制好程序。 3.准备好多组测试数据。 (二)上课上机: 将源代码拷贝到机上调试,发现错误,再修改完善。 第二次上机调试通过。 (三)程序要求: 程序输入/输出示例: 如源程序为C语言。输入如下一段: main() { int a,b; a = 10; b = a + 20; } 要求输出如下: (2,”main”) (5,”(“) (5,”)“) (5,”{“) (1,”int”) (2,”a”) (5,”,”) (2,”b”) (5,”;”) (2,”a”) (4,”=”) (3,”10”) (5,”;”) (2,”b”) (4,”=”) (2,”a”) (4,”+”) (3,”20”) (5,”;”) (5,”}“) 要求: 识别保留字:if、int、for、while、do、return、break、continue; 单词种别码为1。 其他的都识别为标识符;单词种别码为2。 常数为无符号整形数;单词种别码为3。 运算符包括:+、-、*、/、=、>、=、<=、!= ; 单词种别码为4。 分隔符包括:,、;、{、}、(、); 单词种别码为5。 以上为参考,具体可自行增删。 (四)程序思路 这里以开始定义的C语言子集的源程序作为词法分析程序的输入数据。在词法分析中,自文件头开始扫描源程序字符,一旦发现符合“单词”定义的源程序字符串时,将它翻译成固定长度的单词内部表示,并查填适当的信息表。经过词法分析后,源程序字符串(源程序的外部表示)被翻译成具有等长信息的单词串(源程序的内部表示),并产生两个表格:常数表和标识符表,它们分别包含了源程序中的所有常数和所有标识符。 0.定义部分:定义常量、变量、数据结构。 1.初始化:从文件将源程序全部输入到字符缓冲区中。 2.取单词前:去掉多余空白。 3.取单词后:去掉多余空白(可选,看着办)。 4.取单词:利用实验一的成果读出单词的每一个字符,组成单词,分析类型。(关键是如何判断取单词结束?取到的单词是什么类型的单词?)
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

白马无缰

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值