编译原理之词法分析实验(附完整C/C++代码与总结)

该文详细介绍了如何通过编程实现对PL/0语言的词法分析,包括关键字、标识符、常数、运算符和分界符的识别,以及分析和输出过程。程序通过读取用户输入的源代码,进行词法划分,并输出相应的二元序列和单词类型。难点在于处理两个符号的运算符判断和异常情况的处理。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、实验内容

        通过完成词法分析程序,了解词法分析的过程。编制一个读单词程序,对PL/0语言进行词法分析,把输入的字符串形式的源程序分割成一个个单词符号,即基本保留字、标识符、常数、运算符、分界符五大类。

        对PL/0语言进行词法分析,把输入的字符串形式的源程序分割成一个个单词符号,其词法描述如下:

(1)关键字:

begin,call,const,do,end,if,odd,procedure,read,then,var,while,write

(2) 标识符:用来表示各种名字,必须以字母开头小于10位字符组成

(3) 数字:以0-9组成小于14位的数字

(4) 运算符:+,-,*,/,:=,<,<=,>,>=,#

(5) 分界符:, ,. ,; ,( ,)


二、实验代码

#include<iostream>
#include<stdio.h>
#include<string.h>
#include<iomanip>
using namespace std;
//创建四个表,储存符号 
const char *k[13]={"begin","call","const","do","end","if","odd","procedure","read","then","var","while","write"};//关键字表
const char *s1[5]={",",".",";","(",")"};//界符表
const char *s2[6]={"+","-","*","/","++","--",};//运算符号表 
const char *s3[9]={"<=",">",">=","=",">",">=","<>",":=","#"}; //关系运算符号表 
//定义全局变量
int row=1,line=1; 
int t,p=0;//单词类别码以及记录移动指针
char instring[100];//保存输入的程序代码缓存数组
char outtoken[10];//输出
char ci[8],id[10];//暂时保存数字和字符
//函数的声明
void analysis();//分析函数,决定调用哪个函数进行分析
void symbol();//分析以非字母数字开头的字符
void constant();//分析常数
void alphabet();//分析标识符和关键字
void show();//打印输出函数
bool isnumber(char x);//判断是否是数字 
bool isalpha(char x);//判断是否是字母 
int main(){
	cout<<"请输入一段程序代码并以@结束:"<<endl;
	//输出程序代码 
	do{
		instring[p++]=getchar();
	} while(instring[p-1]!='@'); 
	getchar();//吸收回车键 
	instring[p-1]='\0';//抵消掉@
	p=0;//移动指针归零
	cout<<left;
	cout<<"------------------------------------------------------------------------------"<<endl; 
	cout<<setw(6)<<"单词"<<"			"<<setw(6)<<"二元序列"<<"			"<<setw(6)<<"类型"<<"			"<<endl;
	//扫描输入的字符 
	while(p<strlen(instring)){
		analysis();
		show();
	} 
	cout<<"------------------------------------------------------------------------------"<<endl; 
	cout<<"[注]:"<<endl;
	cout<<"t=1:关键字,"<<"t=2:分界符,"<<"t=3:算术运算符,"<<"t=4:关系运算符,"<<"t=5:常数,"<<"t=6:标识符,"<<"t==7:词法出错"<<endl; 
	cout<<"@为结束符,不参与到词法分析中"<<endl; 
	cout<<endl;
	return 0;
} 
//判断是否是数字
bool isnumber(char x){
	return x>='0'&&x<='9';
}
//判断是否是字母
bool isalpha(char x){
	return (x>='a'&&x<='z'||x>='A'&&x<='Z');
}
//分析函数,决定调用哪个函数进行分析
void analysis(){
	strcpy(outtoken,"");//清空outtoken数组
	while(instring[p]==' '||instring[p]=='\n'){
		if(instring[p]=='\n'){
			row++;
			line=1;
		}
		p++;
	} 
	//执行完之后指向第一个不为空格的字符
	char ch=instring[p];
	//按照字符的类别调用不同的分析处理函数 
	if(isalpha(ch))
	   alphabet();
	else if(isnumber(ch))
		constant();
	else 
		symbol();
}
//常数处理函数
void constant(){
	strcpy(ci,"");//清空ci
	t=5;//类别码
	int i=0;
	while(isnumber(instring[p])){
		ci[i++]=instring[p++]; 
	} 
	while(isalpha(instring[p])||isnumber(instring[p])){
		ci[i++]=instring[p++];
		t=7;//出错 
	}
	ci[i]='\0';//结束符
	//strcpy_s(outtoken,strlen(ci)+1,ci);
	strcpy(outtoken,ci);
	line++;
	return; 
} 
//标识符和关键字的分析函数
void  alphabet(){
	strcpy(id,"");//清空id
	int i=0;
	//读取连续的字母数字序列 
	while(isalpha(instring[p])||isnumber(instring[p])){
		id[i++]=instring[p++];//p指向连续序列之后的第一个字符 
	} 
	id[i]='\0';
	//查关键字表 
	for(i=0;i<8;i++){
		if(strcmp(id,k[i])==0){
			t=1;//表示关键字
			line++;
			strcpy(outtoken,id);
			return; //是关键字的话,直接退出 
		}
	}
	//查看是否是标识符
	for(i=0;i<strlen(id);i++){
		if(!(isalpha(id[i])||isnumber(id[i]))){
			t=7;
			strcpy(outtoken,id);
			line++;
			return;
		}
	} 
	line++;
	t=6;//不是关键字且没有出错即为标识符
	strcpy(outtoken,id);
}
//其它运算符的分析函数
void symbol(){
	char ch=instring[p++];
	char ch2=instring[p];
	t=7;
	switch(ch){
		case '+':
			if(ch2=='+')
			  t=3;
			break;
		case '-':
			if(ch2=='-')
			  t=3;
			break;
		case '>':
			if(ch2=='=')
			  t=4;
			break;
		case '<':
			if(ch2=='='||ch2=='>')
			  t=4;
			break;
		case ':':
			if(ch2=='=')
			  t=3;
			break;
	}
	//判断是否具有两个符号的运算符
	if(ch=='>'&&ch2=='='||ch=='<'&&ch2=='='||ch=='<'&&ch2=='>'||ch=='+'&&ch2=='+'||ch=='-'&&ch2=='-'||ch==':'&&ch2=='='){
		p++;
		outtoken[0]=ch;
		outtoken[1]=ch2;
		outtoken[2]='\0';
		line++;
		return;
	} else{
		char chq[2];
		chq[0]=ch;
		chq[1]='\0';
		//分界符比较 
		for(int i=0;i<6;i++){
			if(strcmp(chq,s1[i])==0){
				t=2;
				break;
			}
		}	
		//算术运算符比较 
		for(int i=0;i<6;i++){
			if(strcmp(chq,s2[i])==0){
				t=3;
				break;
			}
		}	
		//关系运算符比较 
		for(int i=0;i<9;i++){
			if(strcmp(chq,s3[i])==0){
				t=4;
				break;
			}
		}
	}
	line++;
	outtoken[0]=ch;
	outtoken[1]='\0';
	return;
} 
//输出函数,根据以上分析函数进行打印输出分析的结果
void show(){
	cout<<left;
	//setw(6)表示占位宽度为6个字符 
	if(t==7){
		cout<<setw(6)<<outtoken<<"			"<<setw(6)<<"ERROR!"<<setw(11)<<" "<<setw(10)<<"ERROR!";
	}else{
		cout<<left;
		cout<<setw(6)<<outtoken<<"			"<<"<"<<t<<","<<outtoken;
		cout<<setw(6-strlen(outtoken))<<">"<<"			";
		switch(t){
			case 1:cout<<left<<setw(10)<<"关键字";break;
			case 2:cout<<left<<setw(10)<<"分界符";break;
			case 3:cout<<left<<setw(10)<<"算术运算符";break;
			case 4:cout<<left<<setw(10)<<"关系运算符";break;
			case 5:cout<<left<<setw(10)<<"常数";break;
			case 6:cout<<left<<setw(10)<<"标识符";break;
		}
	} 
	cout<<endl;
} 
/*变量说明: 
k数组:关键字表; s数组:分界符表,其中分界符,算术运算符,关系运算符分别存放在s1,s2,s3数组中 
id:标识符; ci:常数 ;row:行 line:列,单词的位置 
instring数组:为输入源程序代码的单词缓存; outtoken数组:记录为输出内部表示缓存
 symbol:分析//后的注释;constant:常数分析;alphabet:标识符和关键字分析
analysis:分析函数,根据输入字符判断调用哪一个函数 ;show:输出打印函数
t:单词的种类 t=1:关键字 t=2:分界符 t=3:算术运算符 t=4:关系运算符 t=5:常数 t=6:标识符 t=7:出错*/

三、实验结果

测试一

测试二


 四、实验总结

        整体的代码思路是创建四个数组分别存放关键字表、界符表、运算符号表、关系运算符号表,这样若想新增符号只需要在数组中修改即可,实现动态变化而非写死的。

        下面进行模块化设计,总共分为analysis()、symbol()、constant()、alphabet()、show()、isnumber()、isalpha()七个函数,analysis函数作为总的分析函数,通过分析当前字符是否是字母还是数字或者其它符号,分别调用不同的函数进行具体的分析,然后将结果存储在全局变量outtoken和t中,前者代表输出的二元组,后者代表该单词的类型,难点在于两个符号的运算符的判断。

        本题还有一个细节之处,在输入完代码后敲的那个回车键会多余需要使用一个getchar()函数来吸收掉,并且结束符@为自定义的,不参与到词法分析中,所以在输入完程序代码后使用instring[p-1]='\0';//抵消掉@,这样就使得instring数组里存放的是完整的有效的程序代码,不含结束符。

END.

实验一:词法分析程序 一、实验目的     通过设计编制调试一个具体的词法分析程序,加深对词法分析原理的理解。并掌握在对程序设计语言源程序进行扫描过程中将其分解为各类单词的词法分析方法。 编制一个读单词过程,从输入的源程序中,识别出各个具有独立意义的单词,即基本保留字、标识符、常数、运算符、分隔符五大类。并依次输出各个单词的类型码及单词符号的自身值。(遇到错误时可显示“Error”,然后跳过错误部分继续显示) 二、实验要求 用C或C++写一个简单的词法分析程序,程序可以满足下列要求: 1、能分析如下几种简单的语言词法 (1) 标识符: ID=letter(letter|digit)* (2) 关键字(全部小写) main int float double char if then else switch case break continue while do for (3)整型常量:NUM=digit digit* (4)运算符 = + - * / < <= == != > >= ; ( )? : (5)空格由空白、制表符和换行符组成,用以分隔ID、NUM、运算符等,字符分析时被忽略。 2、单词符号和相应的类别码 假定单词符号和相应的类别码如下: 单词符号 种别码 int 1 = 17 float 2 < 20 if 3 <= 21 switch 4 == 22 while 5 != 23 Do 6 > 24 标识符 10 >= 25 整型常量 11 ; 26 + 13 ( 27 - 14 ) 28 * 15 ? 29 / 16 : 30 3、词法分析程序实现的功能 输入:单词序列(以文件形式提供),输出识别的单词的二元组序列到文件和屏幕 输出:二元组构成: (syn,token或sum) 其中: syn 为单词的种别码 token 为存放的单词自身符号串 sum 为整型常数 例: 源程序: int ab; float ef=20; ab=10+ef; 输出: (保留字--1,int) (标识符--10,ab) (分号--26,;) (保留字--2,float) (标识符--10,ef) (等号--17,=) (整数--11,20) (分号--26,;) (标识符--10,ab) (等号--17,=) (整数--11,10) (加号--13,+) (标识符--10,ef) (分号--26,;) 4、自己准备测试数据存放于TestData.txt文件中,测试数据中应覆盖有以上5种数据,测试结果要求以原数据结果对照的形式输出并保存在Result.txt中,同时要把结果输出到屏幕。 5、提前准备 ① 实验前,先编制好程序,上机时输入并调试程序。 准备好多组测试数据(存放于文件TestData.txt中)。 6、写出实验报告 报告格式:要求有实验名称、实验目的、实验要求、实验内容、实验小结。 其中实验内容包括算法分析、程序流程图及程序代码
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

顾老师不懂代码

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值