Description
小C语言文法
-
<程序>→<main关键字>(){<声明序列><语句序列>}
-
<声明序列>→<声明序列><声明语句>|<声明语句>|<空>
-
<声明语句>→<标识符表>;
-
<标识符表>→<标识符>,<标识符表>|<标识符>
-
<语句序列>→<语句序列><语句>|<语句>
-
<语句>→< if语句>|< while语句>|< for语句>|<复合语句>|<赋值语句>
-
< if语句>→< if关键字>(<表达式>)<复合语句>|(<表达式>)<复合语句>< else关键字><复合语句>
-
< while语句>→< while关键字>(<表达式>)<复合语句>
-
< for语句>→< for关键字>(<表达式>;<表达式>;<表达式>)<复合语句>
-
<复合语句>→{<语句序列>}
-
<赋值语句>→<表达式>;
-
<表达式>→<标识符>=<算数表达式>|<布尔表达式>
-
<布尔表达式>→<算数表达式> |<算数表达式><关系运算符><算数表达式>
-
<关系运算符>→>|<|>=|<=|==|!=
-
<算数表达式>→<算数表达式>+<项>|<算数表达式>-<项>|<项>
-
<项>→<项>*<因子>|<项>/<因子>|<因子>
-
<因子>→<标识符>|<无符号整数>|(<算数表达式>)
-
<标识符>→<字母>|<标识符><字母>|<标识符><数字>
-
<无符号整数>→<数字>|<无符号整数><数字>
-
<字母>→a|b|…|z|A|B|…|Z
-
<数字>→0|1|2|3|4|5|6|7|8|9
-
< main关键字>→main
-
< if关键字>→if
-
< else关键字>→else
-
< for关键字>→for
-
< while关键字>→while
-
< int关键字>→int
每行单词数不超过10个
小C语言文法如上,现在我们对小C语言写的一个源程序进行词法分析,分析出关键字、自定义标识符、整数、界符
和运算符。
关键字:main if else for while int
自定义标识符:除关键字外的标识符
整数:无符号整数
界符:{ } ( ) , ;
运算符:= + - * / < <= > >= == !=
Input
输入一个小C语言源程序,源程序长度不超过2000个字符,保证输入合法。
Output
按照源程序中单词出现顺序输出,输出二元组形式的单词串。
(单词种类,单词值)
单词一共5个种类:
关键字:用keyword表示
自定义标识符:用identifier表示
整数:用integer表示
界符:用boundary表示
运算符:用operator表示
每种单词值用该单词的符号串表示。
Sample
代码:
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
int main()
{
char str[85], s[85];
int i, j, len;
memset(str,0,sizeof(str));
while(gets(str) != NULL)
{
len = strlen(str);
j = 0;
memset(s, 0, sizeof(s));
for(i = 0; i < len; i++)
{
if((str[i] >= 'A' && str[i] <= 'Z') || (str[i] >= 'a' && str[i] <= 'z'))
{
for(; i < len; i++)
{
if((str[i] >= 'A' && str[i] <= 'Z') || (str[i] >= 'a' && str[i] <= 'z') || (str[i] >= '0' && str[i] <= '9'))
{
s[j++] = str[i];
}
else
{
break;
}
}
s[j] = '\0';
if(strcmp(s,"main") == 0 || strcmp(s,"if") == 0 || strcmp(s,"else") == 0 || strcmp(s,"for") == 0 || strcmp(s,"while") == 0 || strcmp(s,"int") == 0)
{
printf("(keyword,%s)\n",s);
}
else
{
printf("(identifier,%s)\n",s);
}
memset(s,0,sizeof(s));
j = 0;
i = i - 1;
}
else if(str[i] == '(' || str[i] == ')' || str[i] == '{' || str[i] == '}' || str[i] == ',' || str[i] == ';')
{
printf("(boundary,%c)\n",str[i]);
}
else if(str[i] >= '0' && str[i] <= '9')
{
for(; i < len; i++)
{
if(str[i] >= '0' && str[i] <= '9')
{
s[j++] = str[i];
}
else
{
break;
}
}
s[j] = '\0';
printf("(integer,%s)\n",s);
memset(s,0,sizeof(s));
j = 0;
i = i - 1;
}
else if(str[i] == '=' || str[i] == '+' || str[i] == '-' || str[i] == '*' || str[i] == '/' || str[i] == '<' || str[i] == '>' || str[i] == '!')
{
if(i == len - 1)
{
printf("(operator,%c)\n",str[i]);
}
else
{
if(str[i + 1] == '=')
{
printf("(operator,%c%c)\n",str[i],str[i + 1]);
i += 1;
}
else
{
printf("(operator,%c)\n",str[i]);
}
}
}
}
memset(str,0,sizeof(str));
}
return 0;
}
本人这学期开始学编译原理这门课,做题的时候在网上找到的参考代码几乎都是C++的,所以我打算分享一份C语言版的给朋友们,我只选择了其中一部分题,如果有不会的而且我还没发的,可以私聊我,我们一起讨论