1、通过设计编制调试一个具体的词法分析程序,加深对词法分析原理的理解。并掌握在对程序设计语言源程序进行扫描过程中将其分解为各类单词的词法分析方法。
2、编制一个读单词过程,留字、标识符、常数、运算符、分隔符五大类。并依次输出各个单词的内部编码及单词符号从输入的源程序中,识别出各个具有独立意义的单词,即基本保自身值。(遇到错误时可显示“Error”,然后跳过错误部分继续显示)
(1)程序输入/输出示例:
如源程序为C语言。输入如下一段:
main()
{
int a,b;
a = 10;
b = a + 20;
}
要求输出如下图。
识别保留字:if、int、for、while、do、return、break、continue;单词种别码为1。
其他的都识别为标识符;单词种别码为2。
常数为无符号整形数;单词种别码为3。
运算符包括: +、-、*、/、=、>、<、>=、<=、!=; 单词种别码为4。
分隔符包括:,、;、{、}、(、); 单词种别码为5。
实验源码
#include <stdio.h>
#include <stdlib.h>
#include <conio.h>
#include <string.h>
FILE *fp;
char nextChar()
{
char ch=EOF;
if(!feof(fp))
{
ch=fgetc(fp);
}
return ch;
}
int main()
{
// ar用于接受下一个字符
char ch,ar;
if((fp=fopen("example.c","r"))==NULL)
{
printf("文件打开失败");
exit(1);
}
while((ch=nextChar())!=EOF)
{
// 判断保留字和标识符
if (ch>='a'&&ch<='z' || ch>='A'&&ch<='Z'|| ch=='_')
{
char str[100];
int index = 0;
str[0] = ch;
// 读取下一次的字符
ar = nextChar();
while (ar>='a'&&ar<='z' || ar>='A'&&ar<='Z'||ar>='0'&&ar<='9'||ar == '_')
{
str[++index] = ar;
ar = nextChar();
}
// 字符串结束
str[++index] = '\0';
ungetc(ar,fp);
if(strcmp("if", str) == 0||strcmp("int", str) == 0
||strcmp("for", str) == 0||strcmp("while", str) == 0
||strcmp("do", str) == 0||strcmp("return", str) == 0
||strcmp("break", str) == 0||strcmp("continue", str) == 0
)
{
printf("(1,\"%s\")\n",str);
}
else
{
printf("(2,\"%s\")\n",str);
}
}
// 判断无符号整形数
else if(ch>='0' && ch<='9')
{
char num[100];
int index = 0;
num[0] = ch;
ar = nextChar();
while(ar>='0' && ar<='9')
{
num[++index] = ar;
ar = nextChar();
}
num[++index] = '\0';
ungetc(ar,fp);
printf("(3,\"%s\")\n",num);
}
// 判断运算符
else if(ch=='+'||ch=='-'||ch=='*'||ch=='/'||ch=='=')
{
printf("(4,\"%c\")\n",ch);
}
else if(ch=='>'||ch=='<'||ch=='!')
{
ar = nextChar();
if(ar=='=')
{
printf("(4,\"%c%c\")\n",ch,ar);
}
else
{
ungetc(ar,fp);
printf("(4,\"%c\")\n",ch);
}
}
// 判断分隔符
else if(ch==','||ch==';'||ch=='{'||ch=='}'||ch=='('||ch==')')
{
printf("(5,\"%c\")\n",ch);
}
}
//关闭文件
fclose(fp);
system("pause");
}