编译原理之词法分析

该程序实现了对简单的程序段进行词法分析,识别数字、标识符、保留字和各种符号,并以二元式输出识别的单词。遇到无法识别的单词时,输出(-1,ERROR)。程序包含对字母、数字的判断,并有一个简单的保留字列表。
摘要由CSDN通过智能技术生成

编写一个程序实现对简单的程序段进行词法分析。

以二元式输出单词符号

若输入一个识别的单词,则输出此单词的二元式 ; 若输入一个无法识别的单词,则输出(-1,ERROR)。 如:(2,if)

#include <iostream>
#include <string.h>
#include <stdio.h>
#include <stdlib.h>
using namespace std;


//保留字
const string KeyWord[] = { "begin", "if", "then", "while", "for", "end", "int", "else"}; //这个还可以有很多东西加,这里只是简单模拟而已,感兴趣的可以自己多加



int syn;  //单词种别码
string  token;       //单词自身字符串

int sum;  //INT整型里的码内值

int i = 0;

//int tag = 1;     //后面判断STRING字符的

bool IsLetter(char ch)   //判断是否为字母
{
	if ((ch >= 'a' && ch <= 'z') || (ch >= 'A' && ch <= 'Z'))
		return true;
	else
		return false;

}

bool IsDigit(char ch)   //判断是否为数字
{
	if (ch >= '0' && ch <= '9')
		return true;
	else
		return false;

}
void scan(string s);//扫描
int main()
{
	string a = "";
	cout << "Enter Your words(end with #):" << endl;
	getline(cin, a,'#');
	cout << "Your words :" << endl;
    cout<<a<<endl;
	do
	{
		scan(a);
		switch (syn)   //最后判断一波syn
		{
			case -1:
				syn = 0;
				break;
			case -2:      //遇到空格跳过
				break;
			default:
				if (syn != 0)
					cout << "( " << syn << "," << token << " )" << endl;
		}

	}
	while (syn != 0);
}

void scan(string s)    //扫描
{
	if (s[i] == ' ')
	{
		syn = -2;
		i++;
	}
	else
	{
		token = "";   //清空当前字符串

		//  1.判断字符是否为数字
		if (IsDigit(s[i]))
		{
			token = ""; //清空当前字符串
			sum = 0;
			while (IsDigit(s[i]))
			{
				sum = sum * 10 + (s[i] - '0');
				i++;  //字符位置++
				syn = 20;   //INT种别码为20
			}
			token += to_string(sum);     //骚操作,直接转化字符串
		}


		// 2.字符为字符串,表现为字母开头衔接任意个数字或字母
		else if (IsLetter(s[i]))
		{

			token = ""; //清空当前字符串
			while (IsDigit(s[i]) || IsLetter(s[i]))
			{
				token += s[i];   //加入token字符串
				i++;
			}

			//s[i] = '\0';  //刚刚上面最后i++了所以补充
			syn = 10;  // 如果是标识符,种别码为10

			//如果是关键字,则用for循环将token与keyword比较找对应的种别码
			for (int j = 0; j < 12; j++)
			{
				if (token == KeyWord[j])    //如果都是string类型,可以直接=相比较,若相等则返回1,否则为0
				{
					syn = j + 1;   //种别码从1开始所以要加1
					break;
				}
			}
		}

		//3. 判断为符号
		else
		{
			token = ""; //清空当前字符串
			switch (s[i])
			{
				case'=':
					syn = 21;
					i++;
					token = "=";
					break;

				case'+':
					syn = 22;
					i++;
					token = "+";
					break;

				case'-':
					syn = 23;
					i++;
					token = "-";
					break;

				case'*':
					syn = 24;
					i++;
					token = "*";
					break;

				case'/':
					syn = 25;
					i++;
					token = "/";
					break;

				case'(':
					syn = 26;
					i++;
					token = "(";
					break;

				case')':
					syn = 27;
					i++;
					token = ")";
					break;

				case'[':
					syn = 28;
					i++;
					token = "[";
					break;

				case']':
					syn = 29;
					i++;
					token = "]";
					break;

				case'{':
					syn = 30;
					i++;
					token = "{";
					break;

				case'}':
					syn = 31;
					i++;
					token = "}";
					break;

				case',':
					syn = 32;
					i++;
					token = ",";
					break;

				case':':
					syn = 33;
					i++;
					token = ":";
					break;

				case';':
					syn = 34;
					i++;
					token = ";";
					break;

				case'>':
					syn = 35;
					i++;
					token = ">";
					if (s[i] == '=')
					{
						syn = 37;
						i++;
						token = ">=";
					}
					break;

				case'<':
					syn = 36;
					i++;
					token = "<";
					if (s[i] == '=')
					{
						syn = 38;
						i++;
						token = "<=";
					}
					break;

				case'!':
					syn = -1;
					i++;
					if (s[i] == '=')
					{
						syn = 40;
						i++;
						token = "!=";
					}
					break;

				case '"':
					syn = -1;
					token += s[i];
					i++;
					while (s[i] != '"')
					{
						if (s[i] == '#')
						{
							tag = 0;
							break;
						}
						else
						{
							token += s[i];
							i++;
						}
					}
					if (tag)
					{
						token += s[i];
						i++;
						syn = 50;
						break;
					}
					else
					{
						syn = -1;
						cout << "双引号只存在一个,非法输入 " << endl;
						break;
					}
				default:
					syn = -1;
					break;
			}
		}
	}


}

 

因为编译器的不同,导致获取输出输入的语句会有所不同,从而导致无法通关,这个问题的话需要读者对某些输出输入代码或者其他代码进行修改。通常在网上查询一会儿就可以解决了。加油!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值