Problem Description
小C语言文法
- <程序>→(){<声明序列><语句序列>}
- <声明序列>→<声明序列><声明语句>|<声明语句>|<空>
- <声明语句>→<标识符表>;
- <标识符表>→<标识符>,<标识符表>|<标识符>
- <语句序列>→<语句序列><语句>|<语句>
- <语句>→< if语句>|< while语句>|< for语句>|<复合语句>|<赋值语句>
- < if语句>→< if关键字>(<表达式>)<复合语句>|(<表达式>)<复合语句>< else关键字><复合语句>
- < while语句>→< while关键字>(<表达式>)<复合语句>
- < for语句>→< for关键字>(<表达式>;<表达式>;<表达式>)<复合语句>
- <复合语句>→{<语句序列>}
- <赋值语句>→<表达式>;
- <表达式>→<标识符>=<算数表达式>|<布尔表达式>
- <布尔表达式>→<算数表达式> |<算数表达式><关系运算符><算数表达式>
- <关系运算符>→>|<|>=|<=|==|!=
- <算数表达式>→<算数表达式>+<项>|<算数表达式>-<项>|<项>
- <项>→<项>*<因子>|<项>/<因子>|<因子>
- <因子>→<标识符>|<无符号整数>|(<算数表达式>)
- <标识符>→<字母>|<标识符><字母>|<标识符><数字>
- <无符号整数>→<数字>|<无符号整数><数字>
- <字母>→a|b|…|z|A|B|…|Z
- <数字>→0|1|2|3|4|5|6|7|8|9
- < main关键字>→main
- < if关键字>→if
- < else关键字>→else
- < for关键字>→for
- < while关键字>→while
- < int关键字>→int
每行单词数不超过10个
小C语言文法如上,现在我们对小C语言写的一个源程序进行词法分析,分析出关键字、自定义标识符、整数、界符
和运算符。
关键字:main if else for while int
自定义标识符:除关键字外的标识符
整数:无符号整数
界符:{ } ( ) , ;
运算符:= + - * / < <= > >= == !=
Input
输入一个小C语言源程序,源程序长度不超过2000个字符,保证输入合法。
Output
按照源程序中单词出现顺序输出,输出二元组形式的单词串。
(单词种类,单词值)
单词一共5个种类:
关键字:用keyword表示
自定义标识符:用identifier表示
整数:用integer表示
界符:用boundary表示
运算符:用operator表示
每种单词值用该单词的符号串表示。
Sample Input
main()
{
int a, b;
if(a == 10)
{
a = b;
}
}
Sample Output
(keyword,main)
(boundary,()
(boundary,))
(boundary,{)
(keyword,int)
(identifier,a)
(boundary,)
(identifier,b)
(boundary,?
(keyword,if)
(boundary,()
(identifier,a)
(operator,==)
(integer,10)
(boundary,))
(boundary,{)
(identifier,a)
(operator,=)
(identifier,b)
(boundary,?
(boundary,})
(boundary,})
#include <iostream>
#include <string>
using namespace std;
string S[5]= {"keyword","identifier","integer","boundary","operator"};
string T[6]= {"main","if","else","for","while","int"};
void panduan(string s)
{
if(s[0]>='0'&&s[0]<='9') //开头是数字肯定就为数字
{
cout<<"("<<S[2]<<","<<s<<")"<<endl;
}
else
{
int f=1;
for(int i=0; i<6; i++)
{
if(s==T[i])
{
f=0;
cout<<"("<<S[0]<<","<<s<<")"<<endl;
break;
}
}
if(f==1)
{
cout<<"("<<S[1]<<","<<s<<")"<<endl;
}
}
}
int main()
{
string s;
while(cin>>s)
{
int len=s.length();
string temp="";
for(int i=0; i<len; i++)
{
//操作符
if(s[i] == '=' || s[i] == '+' || s[i] == '-'||s[i] == '*'|| s[i] == '/' || s[i] == '<' || s[i] == '>' || s[i] == '!')
{
if(temp.length())
{
panduan(temp);
}
temp="";
if(i+1<len&&s[i+1]=='=')
{
cout<<"("<<S[4]<<","<<s[i]<<s[i+1]<<")"<<endl;
i++;
}
else
{
cout<<"("<<S[4]<<","<<s[i]<<")"<<endl;
}
}
//界符
else if(s[i] == '(' || s[i] == ')' || s[i] == '{'||s[i] == '}'|| s[i] == ',' || s[i] ==';')
{
if(temp.length())
{
panduan(temp);
}
temp="";
cout<<"("<<S[3]<<","<<s[i]<<")"<<endl;
}
//不是界符也不是操作符,就存到临时字符串里面,等待判断
else
{
temp=temp+s[i];
}
}
if(temp.length())
{
panduan(temp);
}
}
return 0;
}
c 提交时wrong
#include<stdio.h>
#include<string.h>
int isDigit(char ch)
{
if(ch>='0'&&ch<='9')
return 1;
else return 0;
}
int isLitter(char ch)
{
if(ch>='a'&&ch<='z'||ch>='A'&&ch<='Z')
return 1;
else return 0;
}
int isKeyword(char tmp[])
{
if(!strcmp(tmp,"main")|| !strcmp(tmp,"if") || !strcmp(tmp,"else") || !strcmp(tmp,"for") || !strcmp(tmp,"while") || !strcmp(tmp,"int"))
return 1;
else return 0;
}
void get()
{
char ch;
int line=0;//行数
char tmp[100];
int i=0;
while(~scanf("%c",&ch))
{
if(ch==' '||ch=='\t')//为空格或是tab
continue;
//回车
else if(ch=='\n')
line++;
//是否是界符
else if(ch=='('||ch==')'||ch=='{'||ch=='}'||ch==','||ch==';')
printf("(boundary,%c)\n",ch);
else if(isDigit(ch))//如果是数字
{
while(isDigit(ch))
{
tmp[i++]=ch;
scanf("%c",&ch);
}
tmp[i]='\0';//加上结束符
i=0;
printf("(integer,%s)\n",tmp);
ungetc(ch,stdin);//将字符退回到输入流中
}
else if(isLitter(ch)||ch=='_')
{
while(isLitter(ch)||isDigit(ch)||ch=='_')
{
tmp[i++]=ch;
scanf("%c",&ch);
}
tmp[i]='\0';
i=0;
if(isKeyword(tmp)) //关键字
printf("(keyword,%s)\n",tmp);
else //自定义标识符
printf("(identifier,%s)\n",tmp);
ungetc(ch,stdin);
}
//是否是运算符
else
{
char c=ch;
// if(ch=='='||ch=='<'||ch=='>'||ch=='!')
// {
scanf("%c",&ch);
if(ch=='=') //判断是否是两个字节操作符
printf("(operator,%c=)\n",ch);
// }
// else
// {
else //单个字节操作符
{
printf("(operator,%c)\n",c);
ungetc(ch,stdin);
}
}
}
}
int main()
{
get();
}