词法分析

一、实验目的
(1) 理解词法分析的功能;
(2) 理解词法分析的实现方法;

二、实验内容
PL0的文法如下
‘< >’为非终结符。
‘::=’ 该符号的左部由右部定义,可读作“定义为”。
‘|’ 表示‘或’,为左部可由多个右部定义。
‘{ }’ 表示花括号内的语法成分可以重复。在不加上下界时可重复0到任意次数,有上下界时可重复次数的限制。
‘[ ]’ 表示方括号内的成分为任选项。
‘( )’ 表示圆括号内的成分优先。
上述符号为“元符号”, 文法用上述符号作为文法符号时需要用引号‘’括起。

〈程序〉∷=〈分程序〉.
〈分程序〉∷= [〈变量说明部分〉][〈过程说明部分〉]〈语句〉
〈变量说明部分〉∷=VAR〈标识符〉{,〈标识符〉}:INTEGER;
〈无符号整数〉∷=〈数字〉{〈数字〉}
〈标识符〉∷=〈字母〉{〈字母〉|〈数字〉}
〈过程说明部分〉∷=〈过程首部〉〈分程序〉{;〈过程说明部分〉};
〈过程首部〉∷=PROCEDURE〈标识符〉;
〈语句〉∷=〈赋值语句〉|〈条件语句〉|〈过程调用语句〉|〈读语句〉|〈写语句〉|〈复合语句〉|〈空〉
〈赋值语句〉∷=〈标识符〉∶=〈表达式〉
〈复合语句〉∷=BEGIN〈语句〉{;〈语句〉}END
〈条件〉∷=〈表达式〉〈关系运算符〉〈表达式〉
〈表达式〉∷=〈项〉{〈加法运算符〉〈项〉}
〈项〉∷=〈因子〉{〈乘法运算符〉〈因子〉}
〈因子〉∷=〈标识符〉|〈无符号整数〉|’(‘〈表达式〉’)’
〈加法运算符〉∷=+|-
〈乘法运算符〉∷=*
〈关系运算符〉∷=<>|=|<|<=|>|>=
〈条件语句〉∷=IF〈条件〉THEN〈语句〉
〈字母〉∷=a|b|…|X|Y|Z
〈数字〉∷=0|1|2|…|8|9

实验要求:实现PL0程序的词法分析
1. 完成实验的要求
(1)条件语句改为:
<条件语句> ::= IF <条件> THEN <语句> [ELSE <语句>]
即增加保留字 ELSE
(2)增加注释:
 单行注释:
单行注释以“//”开始,以回车结束。例如下面是一个示例:
//I am comment.
 多行注释:
以“{”开始,以“}”结束。例如下面是一个示例:
{ I am comment. }
(3)识别出整数和实数,并区别
代码已经测试

#include <stdio.h>
#include<stdlib.h>
#include<string.h>
#include<ctype.h>

#define norw 11            //norw-1个关键字
#define al 20            //最长的关键字的长度

#define ID norw
#define INT norw+1
#define COMMA norw+2
#define ENDF norw+3
#define COLON norw+4
#define SEMIC norw+5
#define ADD norw+6
#define MINUS norw+7
#define MULTI norw+8
#define EVALU norw+9
#define LE norw+10
#define NE norw+11
#define LT norw+12
#define EQ norw+13
#define GE norw+14
#define GT norw+15
#define FLOAT norw+16
char TOKEN[20];                      //字符数组用来依次存放单词词文的各个字符

extern int lookup(char *);           //以TOKEN字符串查保留字表
extern void report_error(char);      //报告程序中的词法错误
bool isalpha(char);                  //判断接收字符是否为字母
bool isalnum(char);                  //判断接收字符是否为字母或者数字
bool isdigit(char);                  //判断接收字符是否为数字

FILE* fin;
FILE* fout;

void scanner()
{
    //词法分析的主体程序,对输入的文本文件进行词法分析
    char ch;
    int i,c;
    int error=0;                         //记录文件中词法错误的个数
    ch=fgetc(fin);                        //从输入文件中读取一个字符

    while(ch!=EOF)
    {
        //当从输入文件接收的字符不是文件结束符时,执行循环
        if(isalpha(ch))
        {
            //如果从输入文件接收的第一个字符是字母
            TOKEN[0]=ch;
            ch=fgetc(fin);
            i=1;
            while(isalnum(ch))
            {
                TOKEN[i]=ch;
                i++;
                ch=fgetc(fin);
            }
            TOKEN[i]='\0';
            c=lookup(TOKEN);                   //查保留字表
            if(c==0)
            {
                fprintf(fout,"(%d,%s)\n", ID,TOKEN);   //输出标识符
            }
            else fprintf(fout,"(%d,%s)\n", c,TOKEN);                //输出接收单词为保留字
        }
        if(isdigit(ch))                     //如果从输入文件接收的第一个字符是数字
        {
            int cdot=0;               //统计小数点个数
            TOKEN[0]=ch;
            ch=fgetc(fin);
            i=1;

            while(isdigit(ch)||ch=='.')
            {
                //从第二个接收字符开始,当是数字或者是小数点时,执行循环
                if(ch=='.')
                    cdot++;
                TOKEN[i]=ch;
                i++;
                ch=fgetc(fin);//重复接收字符,直到接收到非数字
                if(cdot>=2)
                {
                    error++;
                    TOKEN[i]='\0';
                    printf("%s is error\n", TOKEN);
                    break;
                }
            }

            if(isalpha(ch)) //如果第二个字符是字母
            {
                while(isalpha(ch)) //接收完所有的字母,跳出循环
                {
                    TOKEN[i]=ch;
                    i++;
                    ch=fgetc(fin);
                }
                TOKEN[i]='\0';
                error++;
                printf("%s is error\n", TOKEN);
            }

            else if(cdot==0)    //当接收的字符为整型单词时
            {
                int x=0;
                fseek(fin,-1,1);
                TOKEN[i]='\0';
                for(int j=0; j<i; j++)
                {
                    x=(TOKEN[j]-'0')*(10^(--i))+x;
                }
                fprintf(fout,"(%d,%d)\n", INT, x);//输出为数字
            }

            else if(cdot==1)
            {
                fseek(fin,-1,1);
                TOKEN[i]='\0';
                int a,part1=0,jc,b=0,e=0;         //b用来确定小数点所在的位置
                float c=0.1,part2=0.0;
                for(e=0; e<i; e++)
                {
                    if(TOKEN[e]!='.')
                        b=e;
                }
                int m=b;
                int x1=0;
                float x2=0.0;
                for(int j=0; j<m; j++)
                {
                    x1=(TOKEN[i]-'0')*(10^(--m))+x1;
                }
                for(int j=b+1; j<i; j++)
                {
                    c=1;
                    for(int y=0; y<(j=b); j++)
                    {
                        c=c*0.1;
                    }

                    x2=x2+float((TOKEN[j]-'0'))*c;
                }
                fprintf(fout,"(%d,%f)\n", FLOAT, x1+x2);                      //输出接收单词为小数
            }
        }
        else            //如果从输入文件接收的第一个字符既不是字母又不是数字
            switch(ch)
            {
            //将所接收到的符号字符进行分类,采取一符一类
            case':':
                ch=fgetc(fin);
                if(ch=='=') fprintf(fout,"(%d,:=)\n", EVALU);           //输出接收符号为赋值号
                else
                {
                    fseek(fin,-1,1);                        //文件接收字符回推一个字符
                    fprintf(fout,"(%d,':')\n", COLON);                     //输出冒号
                }
                break;
            case',':
                fprintf(fout,"(%d,',')\n", COMMA);
                break;                   //输出逗号
            case'.':
                fprintf(fout,"(%d,'.')\n", ENDF);
                break;                    //输出句号
            case';':
                fprintf(fout,"(%d,'.')\n", SEMIC);
                break;                   //输出分号
            case'+':
                fprintf(fout,"(%d,'+')\n", ADD);
                break;                     //输出加号
            case'-':
                fprintf(fout,"(%d,'-')\n", MINUS);
                break;                   //输出减号
            case'*':
                fprintf(fout,"(%d,'*')\n", MULTI);
                break;                   //输出乘号
            case'<':
                ch=fgetc(fin);
                if(ch=='=')fprintf(fout,"(%d,'<=')\n", LE);             //输出小于或等于号
                else if(ch=='>')fprintf(fout,"(%d,'<>')\n", NE);        //输出不等于号
                else
                {
                    fseek(fin,-1,1);
                    fprintf(fout,"(%d,'<')\n", LT);;                 //输出小于号
                }
                break;
            case'=':
                fprintf(fout,"(%d,'=')\n", EQ);
                break;                      //输出等于号
            case'>':
                ch=fgetc(fin);
                if(ch=='=')fprintf(fout,"(%d,'>=')\n", GE);             //输出大于或等于号
                else
                {
                    fseek(fin,-1,1);
                    fprintf(fout,"(%d,'>')\n", GT);                     //输出大于号
                }
                break;
            case' ':
                break;
            case'\n':
                break;
            case'\t':
                break;
            case'/':
                ch=fgetc(fin);//单行注释
                if(ch=='/')
                {
                    while( (ch=fgetc(fin))!='\n')
                    {
                        ch=fgetc(fin) ;
                    }


                }
                else
                {
                    fseek(fin,-1,1);
                    printf("/ is error\n");             //接收非上述字符程序报告词法错误
                    error++;
                }
                break;
            case'{':

                while(1)
                {
                    ch=fgetc(fin);

                    if(ch=='}') break;
                    else if(ch==EOF)
                    {
                        fseek(fin,-1,1);
                        printf("{  is error\n");
                        error++;
                        break;
                    }
                }
                break;
            default:
                printf("%c is error\n", ch);             //接收非上述字符程序报告词法错误
                error++;
                break;
            }
        ch=fgetc(fin);                                          //继续从文件中读取下一个单词,直到文件结束
    }//while循环结束

    printf("共发现%d 个词法错误!",error);
    return;
}

int lookup(char *token)
{
    int j;
    char word[norw][al];
    strcpy(&(word[1][0]), "begin");
    strcpy(&(word[2][0]), "end");
    strcpy(&(word[3][0]), "var");
    strcpy(&(word[4][0]), "integer");
    strcpy(&(word[5][0]), "while");
    strcpy(&(word[6][0]), "do");
    strcpy(&(word[7][0]), "if");
    strcpy(&(word[8][0]), "then");
    strcpy(&(word[9][0]), "procedure");
    strcpy(&(word[10][0]), "else");

    for(j=1; j<=norw-1; j++)if(strcmp(token,word[j])==0) return j; //以TOKEN字符串查保留字表,若查到返回保留字类别码
    return 0;                                              //TOKEN不是保留字,返回0
}



bool isalpha(char c)
{
    //判断接收字符是否为字母
    if((c>='a'&&c<='z')||(c>='A'&&c<='Z'))return 1;
    else return 0;

}
bool isalnum(char c)
{
    //判断接收字符是否为字母或者数字
    if((c>='a'&&c<='z')||(c>='A'&&c<='Z')||(c>='0'&&c<='9'))return 1;
    else return 0;
}

bool isdigit(char c)
{
    //判断接收字符是否为数字
    if(c>='0'&&c<='9')return 1;
    else return 0;
}

int main()
{
    char filename[20];
    printf("请输入文件名:");
    scanf("%s",filename);
    if((fin=fopen(filename,"r"))==NULL) //打开要读取的文本文件
    {
        printf("不能打开文件.\n");
        exit(0);
    }

    printf("请输入保存分析结果的文件名:");
    scanf("%s",filename);
    if((fout=fopen(filename,"w"))==NULL)
    {
        printf("不能打开文件.\n");
        exit(0);
    }

    scanner();    //调用词法分析程序
    getchar();
    getchar();

    fclose(fin);
    fclose(fout);
    return 0;
}

这个主要用于测试写博客,以后会经常更新个人博客

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值