TINY+Scanner词法分析程序设计

TINY+Scanner是一个词法分析程序,它接收TINY+源代码作为输入,输出识别的token序列。遵循最长匹配原则,例如将':='识别为赋值符号。词法分析器识别的token包括关键字(KEY),系统特殊字符(SYM),变量(ID),数值常量(NUM)和字符串常量(STR)。同时,程序能检测并报告词法错误,如非法字符、字符串匹配错误和注释括号不匹配问题。
摘要由CSDN通过智能技术生成
任务:理解 TINY 语言的词法及词法分析器的实现,并基于该词法分析器, 实现拓展语言 TINY+的词法分析器。 
 

要求: 

(1) TINY+词法分析器以 TINY+源代码为输入,输出为识别出的 token 序 列; 

(2) 词法分析器以最长匹配为原则,例如‘:=’应识别为赋值符号而非单独 的‘:’及‘=’; 

(3) Token 以(种别码,属性值)表示,包含以下类型的种别码:

        a) KEY 为关键字; 

        b) SYM 为系统特殊字符; 

        c) ID 为变量; 

        d) NUM 为数值常量; 

        e) STR 为字符串常量。 

(4) 识别词法错误。词法分析器可以给出词法错误的行号并打印出对应的 出错消息,主要包含以下类型的词法错误: a) 非法字符。即不属于TINY+字母表的字符,比如$就是一个非法字符; b) 字符串匹配错误,比如右部引号丢失,如‘scanner c) 注释的右部括号丢失或匹配错误,如 {this is an example 

核心代码:

typetoken定义集:

globals.h
typedef enum 
    /* book-keeping tokens */
   {ENDFILE,ERROR,
    /* reserved words */
    IF,THEN,ELSE,END,REPEAT,UNTIL,READ,WRITE,TRUE1,FALSE1,OR,AND,NOT,INT,BOOL1,STRING,FLOAT,DOUBLE,DO,WHILE,
    /* multicharacter tokens */
    ID,NUM,STR,
    /* special symbols */
    ASSIGN,EQ,LT,MT,ME,LE,PLUS,MINUS,TIMES,OVER,LPAREN,RPAREN,SEMI,COMMA,UPDOX,PERCENT
   } TokenType;
扫描器:
scan.c
/* states in scanner DFA */
typedef enum
   { START,INASSIGN,
生成 TINY 语言词法分析程序可以使用 Lex 工具。Lex 是一个在 Unix 和类 Unix 系统上使用的词法分析器生成器,它可以根据用户提供的正则表达式和动作代码生成词法分析器。 下面是一个简单的 TINY 语言词法分析器的例子: ``` %{ #include <stdio.h> %} %% "begin" { return BEGIN; } "end" { return END; } "if" { return IF; } "then" { return THEN; } "else" { return ELSE; } "while" { return WHILE; } "do" { return DO; } "+" { return ADD; } "-" { return SUB; } "*" { return MUL; } "/" { return DIV; } [0-9]+ { return NUM; } [a-zA-Z]+ { return ID; } [ \t\n\r] { } . { printf("Error\n"); return 0; } %% int main() { int token; while (token = yylex()) { printf("%d ", token); } return 0; } ``` 其中,`%{ %}` 之间的代码是头文件和全局变量的定义。`%%` 之间的代码是正则表达式和动作代码的定义。在这个例子中,我们定义了 TINY 语言中的关键字和运算符的正则表达式,并为每个正则表达式定义了相应的动作代码。`[0-9]+` 表示匹配一个或多个数字,`[a-zA-Z]+` 表示匹配一个或多个字母。 在主函数中,我们使用 `yylex()` 函数来获取下一个词单元的类型。如果识别到一个词单元,就会返回相应的 token 值,否则返回 0。 使用 Lex 工具生成词法分析器的命令为: ``` lex lexer.l ``` 其中,`lexer.l` 是包含上述代码的文件名。生成的词法分析器为 `lex.yy.c`,可以通过编译器编译成可执行文件。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值