编译原理:PL/0语言词法分析

PL/0语言词法分析


///
//
/

要求

输入PL/0语言源程序
输出二元式序列,(单词种类,单词的值)

准备工作

该语言的保留字,标识符以及数字可用一个状态机来识别,其余符号可用一个单独的状态机来识别。
正规式如下:
字母开头:letter(letter|digit)*
数字开头:digit(digit)*
符号省略

将正规式转换为DFA
符号识别自动机省略

程序流程图

在这里插入图片描述

开始写程序

首先,规定几个变量与函数。

  • ch 字符,全局变量, 用来存放读入的字符
  • strToken 字符数组, 全局变量,用来存放构成单词符号的字符串
  • table表, 字符串数组,作为保留字表,存放保留字
  • symbol表, 字符串数组,作为符号表
  • GetChar()函数, 读取下一个字符到ch
  • GetBC()函数, 跳过空格
  • Concat()函数, 将ch中的字符连接到strToken
  • Reserve()函数, 查找保留字表,strToken中现有字符串是否为保留字
  • Isletter()函数 和 Isdigital()函数, 判断ch中的字符是字母还是数字
  • RetChar()函数, 返回保留字对应编码

大体思想:在识别到一个完整的字母开头的单词后,查找保留字表,如果为保留字返回对应的编码,如果不是将该字符串识别为ident,整个源程序以 . 结尾,识别到.则结束程序,返回所有二元式序列。

设计思路因人而异,以上为本人设计思路,仅供参考。

代码

#include <stdio.h>
#include <string.h>
#include <stdbool.h>

char ch;                                        //全局变量ch,用来存放读入字符
char strToken[255]="";                          //全局变量,用来存放构成单词符号的字符串
char table[13][10]={"begin","call",
                    "const","do","end","if",
                    "odd","procedure",
                    "read","then",
                    "var","while","write"};                //保留字表
char symbol[16][3]={"+","-","*",
                    "/","=","<>",
                    "<","<=",">",
                    ">=",":=","(",
                    ")",",",";","."};                       //符号表

void GetChar(){
    ch=getchar();
}                                                            //读入字符到ch

void GetBC(){
    if(ch==' ')
        GetChar();
}                                                          //跳过空白符

void Concat(){
    strcat(strToken,&ch);
}                                                     //将ch中的字符连接到strToken

int Reserve(){
    int index=-1;
    int i;
    for(i=0;i<14;i++)
    {
        if(strcmp(strToken,&table[i])==0)
        {
            index=i;
            break;
        }
    }
    if(index>=0)
        return index;
    else
        return -1;

}                                                 //查找保留字表,strToken是否为保留字

bool Isletter(){
    if((ch>='a'&&ch<='z')||(ch>='A'&&ch<='Z'))
        return true;
    else
        return false;
}                                                             //判断ch是否为字母

bool Isdigital(){
    if(ch>='0'&&ch<='9')
        return true;
    else
        return false;
}                           //判断ch是否为数字

char RetChar(int x,char a[]){
    switch (x){
        case 0:strcpy(a,"beginsym");break;
        case 1:strcpy(a,"callsym");break;
        case 2:strcpy(a,"constsym");break;
        case 3:strcpy(a,"dosym");break;
        case 4:strcpy(a,"endsym");break;
        case 5:strcpy(a,"ifsym");break;
        case 6:strcpy(a,"addsym");break;
        case 7:strcpy(a,"proceduresym");break;
        case 8:strcpy(a,"readsym");break;
        case 9:strcpy(a,"thensym");break;
        case 10:strcpy(a,"varsym");break;
        case 11:strcpy(a,"whilesym");break;
        case 12:strcpy(a,"writesym");break;
        default:strcpy(a,"error");break;

    }
}                                                           //返回保留字对应编码




void main() {
    int code;
    char word[20];
    GetChar();
    while(ch!='\0') {
        strcpy(strToken,"");
        GetBC();

        if (Isletter()) {                                     //状态1
            Concat();                                      
            GetChar();
            if (Isletter() || Isdigital()) {                //状态3
                Concat();
                GetChar();
                while (Isletter() || Isdigital()) {
                    Concat();
                    GetChar();
                }
            }
            code = Reserve();
            if (code != -1) {
                RetChar(code,word);
            } else
                strcpy(word,"ident");
            printf ("(%s,%s)\n",word, strToken);
        }                                                  //字母开头识别

        else if (Isdigital()) {                         //状态2
            Concat();
            GetChar();
            if (Isdigital()) {                           //状态4
                Concat();
                GetChar();
                while (Isdigital()) {
                    Concat();
                    GetChar();
                }
                strcpy(word,"number");
            }
            printf ("(%s,%s)\n",word, strToken);
        }                                                    //数字开头

        else if (ch=='\n')
        {GetChar();}                                        //换行符识别

        else {
            if (ch == '+') {
                printf("(plus,+)\n");
                GetChar();
            } else if (ch == '-') {
                GetChar();
                printf("(minus,-)\n");
            }
            else if (ch == '*') {
                GetChar();
                printf("(times,*)\n");
            }
            else if (ch == '/') {
                GetChar();
                printf("(slash,/)\n");
            }
            else if (ch == '=') {
                GetChar();
                printf("(eql,=)\n");
            }
            else if (ch == '<') {
                GetChar();
                if (ch == '>') {
                    GetChar();
                    printf("(neq,<>)\n");
                }
                else if (ch == '=') {
                    GetChar();
                    printf("(leq,<=)\n");
                }
                else printf("(lss,<)\n");
            } else if (ch == '>') {
                GetChar();
                if (ch == '=') {
                    GetChar();
                    printf("(geq,>=)\n");
                }
                else printf("(gtr,>)\n");
            } else if (ch == ':') {
                GetChar();
                if (ch == '=') {GetChar();printf("(becomes,:=)\n");}
                else printf("(error,:)\n");
            } else if (ch == '(') {
                GetChar();
                printf("(lparen,()\n");
            }
            else if (ch == ')') {
                GetChar();
                printf("(rparen,))\n");
            }
            else if (ch == ',') {
                GetChar();
                printf("(comma,,)\n");
            }
            else if (ch == ';') {
                GetChar();
                printf("(semicolon,;)\n");
            }
            else if (ch == '.') {
                GetChar();
                printf("(period,.)\n");
            }
        }                                                    //符号与界符

    }                                                        //主体循环




}

测试一下

输入:
const a=10;
var b,c;
begin
read(b);
c:=a+b;
write(c)
end.

测试结果:

应该没毛病吧

  • 9
    点赞
  • 63
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
### 回答1: 这是一个需要用C语言编写的PL/词法分析器,它的主要作用是为语法和语义分析提供单词。它能够将输入的字符串形式的源程序分割成一个个单词符号,并将分析结果(包括基本字、运算符、标识符、常数和界符)存储和输。 ### 回答2: 为了完成这个任务,需要以下步骤: 1. 定义pl/0语言的所有符号类型,包括基本字、运算符、标识符、常数和界符。 2. 读取源程序字符串形式,一个字符一个字符地逐一读入,然后对每个字符进行识别。对于每个识别来的单词符号,需要记录它的类型、内容(例如标识符的名字或常数的值)和行列信息(方便后续的错误提示)。 3. 根据定义好的符号类型,编写相关的识别规则。例如,对于数字和字母,需要分别进行合法性检查,以区分它们是常数还是标识符。 4. 将识别来的单词符号按照语法语义分析所需的顺序排序,以便后续处理。 5. 将分析结果存储到相应的数据结构,通常是一个符号表,记录每个标识符的类型、地址和作用域等信息。 6. 最后,将分析结果输,通常是在屏幕或者文件打印每个单词符号的类型和内容。 总的来说,编写pl/0词法分析器的难点在于对pl/0语言的规则的理解和对各种符号的识别和分类处理。此外,需要注意代码的可读性和健壮性,在实现过程遇到问题要及时调试和解决。 ### 回答3: PL/0是一种堆栈操作指令式的编程语言。在PL/0语言的编写过程,需要使用词法分析器来将源程序分割为不同的单词,这些单词可以通过语法语义分析器进行处理。因此,编写一个用C语言编写的PL/0词法分析器是非常必要的。 对于PL/0词法分析器的实现,需要考虑以下几个方面: 1. 词法分析器如何解析输入的字符串 2. 如何使用ADT(抽象数据类型)建立符号表,以存储单词 3. 如何进行基本字、运算符、标识符、常数以及界符的识别和存储 下面我们来一一解答这些问题: 1. 词法分析器如何解析输入的字符串? 在PL/0语言,关键字、标识符和常数可以使用字母和数字的组合表示。例如,字母可以用$a$到$z$或$A$到$Z$表示,而数字可以用$0$到$9$表示。其他的标点符号和运算符也可以使用简单的字符表示。在词法分析,可以使用正则表达式对字符串进行解析,将字符串拆分为不同的单词。解析完成后,将这些单词存储在一个符号表,以便后续的语法语义分析使用。 2. 如何使用ADT(抽象数据类型)建立符号表,以存储单词? 为了记录PL/0程序现的所有单词,需要使用抽象数据类型(ADT)进行符号表的存储。符号表应该包含关键字、常量、变量、过程名等单词,这些都应该使用单一的数据结构进行存储。可以考虑将符号表实现为散列表或二叉搜索树。 3. 如何进行基本字、运算符、标识符、常数以及界符的识别和存储? 识别基本字和运算符是比较简单的,可以使用一个Switch语句来对不同类型的单词进行处理。对于标识符和常数,需要使用正则表达式来识别其模式,并将其存储在符号表。对于界符,可以使用类似于基本字和运算符的方法来处理。 总的来说,编写PL/0词法分析器需要了解PL/0语言的语法和特性,并需要熟悉正则表达式和ADT的实现方法。只要理解了这些关键点,就可以很容易地编写一个高效、可靠的PL/0词法分析器,并为后续的语法分析和语义分析提供支持。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值