编译原理(词法分析器)

#include<stdio.h>
#include<stdlib.h>
#include<string.h>
#define _KEY_WORD_END "warting for your expanding"
char m_getch();
void getbc();
void concat();
int letter();
int digit();
int reserve();
char * dtb();
void retract();

typedef struct {
	int typenum;//种类号
	char * word;//关键词
}WORD;
char input[255];//输入缓冲区
char token[255]="";//字符缓冲区
int p_input;//输入缓冲区的指针
int p_token;//单词缓冲区指针
char ch;//读取当前输入的字符串
char * rwtab[] = {"begin","if","then","while","do","end",_KEY_WORD_END};
WORD * scaner();
int main(){
	int over = 1;
	WORD * oneword = new WORD;
	printf("Enter Your words ( end with '#'):");
	scanf("%[^#]s",input);
	p_input = 0;
	printf("Your words:\n%s\n",input);
	while(over<100&&over!=-1){
	
		oneword = scaner();
		if(oneword->typenum<100){
			printf("%d,%s",oneword->typenum,oneword->word);
			over = oneword->typenum;
		}
	}
	printf("\npress # to exit:");
	scanf("%[^#]s",input);
	/*需要用到的自编函数的实现*/
	/*从输入缓冲区中读取一个字符串到ch中*/
	return 0;
	}

char m_getch(){
	ch = input[p_input];
	p_input = p_input++;
	return ch;
}
/*去掉空白符号*/
void getbc(){
	while (ch == '' || ch == 10){
		ch = input[p_input];
		p_input = p_input++;
	}
}
/*拼接单词*/
void concat(){
	token[p_token] = ch;
	p_token = p_token + 1;
	token[p_token] = '\0';

}
/*判断是否是字母*/
int letter(){
	if (ch >= 'a'&&ch <= 'z' || ch >= 'A'&&ch <= 'Z'){
		return 1;
	}
	else{
		return 0;
	}
}
/*判断是否为数字*/
int digit(){
	if (ch >= '0'&&ch <= '9'){
		return 1;
	}
	else{
		\
			return 0;
	}
}
/*检索关键字表格*/
int reserve(){
	int i = 0;
	while (strcmp(rwtab[i], _KEY_WORD_END)){
		if (!strcmp(rwtab[i], token)){
			return i + 1;
		}
		i++;

	}
	return 10;
}
/*退回一个字符*/
void retract(){
	p_input = p_input - 1;
}

/*将数字转换成二进制的数字*/

char * dtb(){
	return NULL;
}

/*这里还没有实现*/

/*语法扫描程序*/
WORD * scaner(){
	WORD * myword = new WORD;
	myword->typenum = 10;
	myword->word = "";
	p_token = 0;
	m_getch();
	getbc();
	if (letter()){
		while (letter() || digit()){
			concat();
			m_getch();
		}
		retract();
		myword->typenum = reserve();
		myword->word = token;
		return (myword);
	}
	else if (digit()){
		while (digit()){
			concat();
			m_getch();
		}
		retract();
		myword->typenum = 20;
		myword->word = token;
		return (myword);

	}
	else switch (ch){
	case '=': m_getch();
		if (ch == '='){
			myword->typenum = 39;
			myword->word = '==';
			return myword;
		}
		retract();
		myword->typenum = 21;
		myword->word = "=";
		return myword;
		break;
	case '+':
		myword->typenum = 22;
		myword->word = "+";
		return(myword);
		break;
	case '-':
		myword->typenum = 23;
		myword->word = "-";
		return(myword);
		break;
	case '*':
		myword->typenum = 24;
		myword->word = "*";
		return(myword);
		break;
	case '/':
		myword->typenum = 25;
		myword->word = "/";
		return(myword);
		break;
	case '(':
		myword->typenum = 26;
		myword->word = "(";
		return(myword);
		break;
	case ')':
		myword->typenum = 27;
		myword->word = ")";
		return(myword);
		break;
	case '[':
		myword->typenum = 28;
		myword->word = "[";
		return(myword);
		break;
	case ']':
		myword->typenum = 29;
		myword->word = "]";
		return(myword);
		break;
	case '{':
		myword->typenum = 30;
		myword->word = "{";
		return(myword);
		break;
	case '}':
		myword->typenum = 31;
		myword->word = "}";
		return(myword);
		break;
	case ',':
		myword->typenum = 32;
		myword->word = ",";
		return(myword);
		break;
	case ':':
		myword->typenum = 33;
		myword->word = ":";
		return(myword);
		break;
	case ';':
		myword->typenum = 34;
		myword->word = ";";
		return(myword);
		break;
	case '>': m_getch();
		if (ch == '='){
			myword->typenum = 37;
			myword->word = '>=';
			return myword;
		}
		retract();
		myword->typenum = 35;
		myword->word = ">";
		return myword;
		break;
	case '<': m_getch();
		if (ch == '='){
			myword->typenum = 38;
			myword->word = '<=';
			return myword;
		}
		retract();
		myword->typenum = 36;
		myword->word = "<";
		return myword;
		break;
	case '!': m_getch();
		if (ch == '='){
			myword->typenum = 40;
			myword->word = '!=';
			return myword;
		}
		retract();
		myword->typenum = -1;
		myword->word = "ERROR";
		return myword;
		break;
	case '\0':
		myword->typenum = 1000;
		myword->word = "OVER";
		return (mywrod);
		break;
	default: myword->typenum = -1;
		myword->word = "ERROR";
		return (myword);




	}
} 
这里有一个小问题要告诉大家,这个代码是有问题的,真是做个一参考作用,可不要直接复制粘贴啊。主要是给没有思路的开发者提供一个解决问题的思路顺便也是一个参考的答案
词法分析 一、实验目的: 通过设计编制调试一个具体的词法分析程序,加深对词法分析原理的理解。并掌握在对程序设计语言源程序进行扫描过程中将其分解为各类单词的词法分析方法。 编制一个读单词过程,从输入的源程序中,识别出各个具有独立意义的单词,即基本保留字、标识符、常数、运算符、分隔符五大类。并依次输出各个单词的内部编码及单词符号自身值。(遇到错误时可显示“Error”,然后跳过错误部分继续显示) 二、实验说明 1、 词法分析器的功能和输出格式 词法分析器的功能是输入源程序,输出单词符号。词法分析器的单词符号常常表示成以下的二元式(单词种别码,单词符号的属性值)。本实验中,采用的是一类符号一种别码的方式。 2、 单词的BNF表示 -> ->|| |ε -> -> |ε -> + -> - -> > -> >= 三、实验要求 (一)准备: 1.阅读课本有关章节,明确语言的语法,写出基本保留字、标识符、常数、运算符、分隔符和程序例。 2.初步编制好程序。 3.准备好多组测试数据。 (二)上课上机: 将源代码拷贝到机上调试,发现错误,再修改完善。 第二次上机调试通过。 (三)程序要求: 程序输入/输出示例: 如源程序为C语言。输入如下一段: main() { int a,b; a = 10; b = a + 20; } 要求输出如下: (2,”main”) (5,”(“) (5,”)“) (5,”{“) (1,”int”) (2,”a”) (5,”,”) (2,”b”) (5,”;”) (2,”a”) (4,”=”) (3,”10”) (5,”;”) (2,”b”) (4,”=”) (2,”a”) (4,”+”) (3,”20”) (5,”;”) (5,”}“) 要求: 识别保留字:if、int、for、while、do、return、break、continue; 单词种别码为1。 其他的都识别为标识符;单词种别码为2。 常数为无符号整形数;单词种别码为3。 运算符包括:+、-、*、/、=、>、=、<=、!= ; 单词种别码为4。 分隔符包括:,、;、{、}、(、); 单词种别码为5。 以上为参考,具体可自行增删。 (四)程序思路 这里以开始定义的C语言子集的源程序作为词法分析程序的输入数据。在词法分析中,自文件头开始扫描源程序字符,一旦发现符合“单词”定义的源程序字符串时,将它翻译成固定长度的单词内部表示,并查填适当的信息表。经过词法分析后,源程序字符串(源程序的外部表示)被翻译成具有等长信息的单词串(源程序的内部表示),并产生两个表格:常数表和标识符表,它们分别包含了源程序中的所有常数和所有标识符。 0.定义部分:定义常量、变量、数据结构。 1.初始化:从文件将源程序全部输入到字符缓冲区中。 2.取单词前:去掉多余空白。 3.取单词后:去掉多余空白(可选,看着办)。 4.取单词:利用实验一的成果读出单词的每一个字符,组成单词,分析类型。(关键是如何判断取单词结束?取到的单词是什么类型的单词?)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

nihui123

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值