编译原理实验(一):词法分析-根据 PL/0 语言的文法规范,编写 PL/0 语言的词法分析程序

**

任务说明

**
1. 实验目的
根据 PL/0 语言的文法规范,编写 PL/0 语言的词法分析程序;或者调研词法分析程序的自动生成工具 LEX 或 FLEX,设计并实现一个能够输出单词序列的词法分析器。通过设计调试词法分析程序,实现从源程序中分出各种单词的方法;加深对课堂教学的理解;提高词法分析方法的实践能力。 掌握从源程序文件中读取有效字符的方法和产生源程序的内部表示文件的方法。
 掌握词法分析的实现方法。
 上机调试编出的词法分析程序。
2. 实验准备
C++
3.实验内容
已给 PL/0 语言文法,输出单词符号(关键字、专用符号以及其它标记)。
4. 实验要求 
把词法分析器设计成一个独立一遍的过程。 词法分析器的输出形式采用二元式序列,即:(单词种类, 单词的值)
5. 输入输出
输入:PL/0 源程序。例: const a=10;
var b,c;
begin
read(b);
c:=a+b;
write©
end.
输出:
(constsym,const)
(ident , a)
(eql , =)
(number, 10)
(semicolon, ; )
(varsym, var )
(ident, b)
(comma, , )
(ident, c )
(semicolon, ; )
(beginsym,begin)
(readsym, read )
(lparen, ( )
(ident, b)
(rparen, ) )
(semicolon, ; )
(ident, c )
(becomes, := )
(ident, a )
(plus, + )
(ident, b )
(semicolon, ; )
(writesym,write)
(lparen, ( )
(ident, c )
(rparen, ) )
(endsym, end )
(period, .)

具体实现

设计

在这里插入图片描述
为了画图简便,假设字母为Z,数字为D,运算符为Y,界符为J
设计r->NFA->DFA(最小化)
识别所有单词的r=(Z(Z|D))|((D)(D))|Y|J
NFA如下:
在这里插入图片描述
在这里插入图片描述

算法流程

在这里插入图片描述

代码

#include <iostream>
#include <fstream>
#include <string>
using namespace std;
//用于识别是基本字或标识符
void Letter(string str){
   
    /*-------------------识别基本字--------------------*/
    if(str=="begin")
        cout<<"(beginsym,begin)"<<endl;
    else if(str=="call")
        cout<<"(callsym,call)"<<endl;
    else if(str=="const")
        cout<<"(constsym,const)"<<endl;
    else if(str=="do")
       cout<<"(dosym,do)"<<endl;
    
  • 17
    点赞
  • 121
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
好的,我可以帮你构造递归下降分析程序。根据上述BNF文法,我们可以将其转换为如下的语法规则: ``` <程序> -> "problem" <标识符> ":" <程序体> "." <程序体> -> "begin" <语句串> "end" <语句串> -> <语句> { ";" <语句> } <语句> -> <赋值语句> | <条件语句> | <循环语句> <赋值语句> -> <变量> "=" <表达式> <条件语句> -> "if" <表达式> "then" <语句> "else" <语句> <循环语句> -> "while" <表达式> "do" <语句> <表达式> -> <项> { ("+" | "-") <项> } <项> -> <因子> { ("*" | "/") <因子> } <因子> -> <无符号常量> | <变量> | "(" <表达式> ")" <变量> -> <标识符> <标识符> -> 字母 { 字母 | 数字 } <无符号常量> -> 数字 { 数字 } ``` 接下来,我们按照递归下降分析的方法,分别对每个非终结符编写一个函数。具体实现如下: ```python # 定义全局变量 pos = 0 # 记录当前处理到的位置 text = "" # 记录要分析的文本 def match(expected): """匹配终结符""" global pos if pos < len(text) and text[pos] == expected: pos += 1 else: raise Exception("Syntax Error: expected {} but got {}".format(expected, text[pos])) def is_alpha(ch): """判断是否为字母""" return ch.isalpha() def is_digit(ch): """判断是否为数字""" return ch.isdigit() def program(): """处理 <程序>""" match("problem") identifier() match(":") program_body() match(".") def program_body(): """处理 <程序体>""" match("begin") statement_list() match("end") def statement_list(): """处理 <语句串>""" statement() while pos < len(text) and text[pos] == ";": match(";") statement() def statement(): """处理 <语句>""" if text[pos] == "if": conditional_statement() elif text[pos] == "while": loop_statement() else: assignment_statement() def assignment_statement(): """处理 <赋值语句>""" variable() match("=") expression() def conditional_statement(): """处理 <条件语句>""" match("if") expression() match("then") statement() match("else") statement() def loop_statement(): """处理 <循环语句>""" match("while") expression() match("do") statement() def expression(): """处理 <表达式>""" term() while pos < len(text) and text[pos] in ("+", "-"): if text[pos] == "+": match("+") else: match("-") term() def term(): """处理 <项>""" factor() while pos < len(text) and text[pos] in ("*", "/"): if text[pos] == "*": match("*") else: match("/") factor() def factor(): """处理 <因子>""" if is_digit(text[pos]): unsigned_constant() elif text[pos] == "(": match("(") expression() match(")") else: variable() def variable(): """处理 <变量>""" identifier() def identifier(): """处理 <标识符>""" if not is_alpha(text[pos]): raise Exception("Syntax Error: expected an alphabet but got {}".format(text[pos])) pos += 1 while pos < len(text) and (is_alpha(text[pos]) or is_digit(text[pos])): pos += 1 def unsigned_constant(): """处理 <无符号常量>""" if not is_digit(text[pos]): raise Exception("Syntax Error: expected a digit but got {}".format(text[pos])) pos += 1 while pos < len(text) and is_digit(text[pos]): pos += 1 def parse(input_text): """解析输入文本""" global pos, text pos = 0 text = input_text program() if pos == len(text): print("Parsing Succeeded") else: raise Exception("Syntax Error: unexpected end of input") ``` 在上述代码中,我们定义了全局变量 `pos` 和 `text`,分别表示当前处理到的位置和要分析的文本。然后,我们编写了每个非终结符对应的函数,如 `program()`、`program_body()`、`statement_list()` 等。 在每个函数中,我们使用了递归的方法,不断调用其他函数,处理重复出现的子表达式。 最后,我们编写了一个 `parse()` 函数,用来解析输入文本。在解析过程中,我们首先调用 `program()` 函数,然后检查是否已经处理完了整个输入文本。 使用时,只需要调用 `parse()` 函数,传入要分析的文本即可。例如,对于输入文本: ``` problem example: begin x = 2 * (3 + y) / 4; if x > 0 then y = 2; else y = 3; while y < 10 do y = y + 1; end end. ``` 我们可以这样调用: ```python parse("""problem example: begin x = 2 * (3 + y) / 4; if x > 0 then y = 2; else y = 3; while y < 10 do y = y + 1; end end.""") ``` 程序将会输出 `"Parsing Succeeded"`,表示分析成功。如果输入的文本不符合语法规则,则会抛出异常,给出相应的错误信息。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值