词法分析编译原理c语言代码大全,编译原理词法分析和语法分析报告+代码(C语言版).doc...

编译原理词法分析和语法分析报告+代码(C语言版)

第 PAGE \* Arabic \* MERGEFORMAT 24 页

词法分析

实验目的

设计、编制并调试一个词法分析程序,加深对词法分析原理的理解。

实验要求

2.1 待分析的简单的词法

(1)关键字:

begin if then while do end

所有的关键字都是小写。

(2)运算符和界符

: = + - * / < <= <> > >= = ; ( ) #

(3)其他单词是标识符(ID)和整型常数(SUM),通过以下正规式定义:

ID = letter (letter | digit)*

NUM = digit digit*

(4)空格有空白、制表符和换行符组成。空格一般用来分隔ID、SUM、运算符、界符和关键字,词法分析阶段通常被忽略。

2.2 各种单词符号对应的种别码:

表2.1 各种单词符号对应的种别码

单词符号

种别码

单词符号

种别码

bgin

1

17

If

2

:=

18

Then

3

<

20

wile

4

<>

21

do

5

<=

22

end

6

>

23

lettet(letter|digit)*

10

>=

24

dight dight*

11

=

25

+

13

26

14

(

27

*

15

)

28

/

16

#

0

2.3 词法分析程序的功能:

输入:所给文法的源程序字符串。

输出:二元组(syn,token或sum)构成的序列。

其中:syn为单词种别码;

token为存放的单词自身字符串;

sum为整型常数。

例如:对源程序begin x:=9: if x>9 then x:=2*x+1/3; end #的源文件,经过词法分析后输出如下序列:

(1,begin)(10,x)(18,:=)(11,9)(26,;)(2,if)……

三、词法分析程序的算法思想:

算法的基本任务是从字符串表示的源程序中识别出具有独立意义的单词符号,其基本思想是根据扫描到单词符号的第一个字符的种类,拼出相应的单词符号。

3.1 主程序示意图:

主程序示意图如图3-1所示。其中初始包括以下两个方面:

⑴ 关键字表的初值。

关键字作为特殊标识符处理,把它们预先安排在一张表格中(称为关键字表),当扫描程序识别出标识符时,查关键字表。如能查到匹配的单词,则该单词为关键字,否则为一般标识符。关键字表为一个字符串数组,其描述如下:

Char *rwtab[6] = {“begin”, “if”, “then”, “while”, “do”, “end”,};

置初值

置初值

调用扫描子程序

调用扫描子程序

输出单词二元组

输出单词二元组

输入串结束 否

输入串结束

结束

结束

图3-1

(2)程序中需要用到的主要变量为syn,token和sum

3.2 扫描子程序的算法思想:

首先设置3个变量:①token用来存放构成单词符号的字符串;②sum用来整型单词;③syn用来存放单词符号的种别码。扫描子程序主要部分流程如图3-2所示。

变量初始化

变量初始化

忽略空格

忽略空格

是否文件结束?

是否文件结束?

返回 是 是

返回

字母

拼字符串 数字 其他

拼字符串

运算符、 符号

界符等符号

是否关键字?返回拼数

是否关键字?

返回

拼数

对不同符号给出相应的syn值报错

对不同符号给出相应的syn值

报错

syn=10 是

syn=10

syn=1111syn为对应关键字的单词种别码

syn=1111

syn为对应关键字的单词种别码

图 3-2

四、词法分析程序的C语言程序源代码:

#include

#include

char prog[80],token[8],ch;

int syn,p,m,n,sum;

char *rwtab[6]={"begin","if","then","while","do","end"};

sca

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
词法分析器是编译器的重要组成部分,用于将源代码转换为词法单元。以下是一个简单的词法分析器的C语言代码: ```c #include <stdio.h> #include <stdlib.h> #include <ctype.h> #define MAX_LENGTH 100 typedef enum { INT, FLOAT, IDENTIFIER, ADD_OP, SUB_OP, MUL_OP, DIV_OP, ASSIGN_OP, SEMICOLON, INVALID } TokenType; typedef struct { TokenType type; char lexeme[MAX_LENGTH]; } Token; Token getNextToken(FILE* fp) { Token token; char ch; int lexemeIndex = 0; token.type = INVALID; // 忽略空格和换行符 while ((ch = fgetc(fp)) != EOF && isspace(ch)); if (ch == EOF) { token.lexeme[0] = '\0'; return token; } // 处理整数和浮点数 if (isdigit(ch)) { token.type = INT; while (isdigit(ch)) { if (lexemeIndex >= MAX_LENGTH - 1) { printf("Error: Token length exceeds the maximum limit.\n"); exit(1); } token.lexeme[lexemeIndex++] = ch; ch = fgetc(fp); } if (ch == '.') { token.type = FLOAT; token.lexeme[lexemeIndex++] = ch; ch = fgetc(fp); while (isdigit(ch)) { if (lexemeIndex >= MAX_LENGTH - 1) { printf("Error: Token length exceeds the maximum limit.\n"); exit(1); } token.lexeme[lexemeIndex++] = ch; ch = fgetc(fp); } } token.lexeme[lexemeIndex] = '\0'; ungetc(ch, fp); return token; } // 处理标识符和关键字 if (isalpha(ch)) { while (isalnum(ch)) { if (lexemeIndex >= MAX_LENGTH - 1) { printf("Error: Token length exceeds the maximum limit.\n"); exit(1); } token.lexeme[lexemeIndex++] = ch; ch = fgetc(fp); } token.lexeme[lexemeIndex] = '\0'; ungetc(ch, fp); // 检查是否是关键字 if (strcmp(token.lexeme, "if") == 0 || strcmp(token.lexeme, "else") == 0 || strcmp(token.lexeme, "while") == 0) { token.type = KEYWORD; } else { token.type = IDENTIFIER; } return token; } // 处理操作符和分号 switch (ch) { case '+': token.type = ADD_OP; break; case '-': token.type = SUB_OP; break; case '*': token.type = MUL_OP; break; case '/': token.type = DIV_OP; break; case '=': token.type = ASSIGN_OP; break; case ';': token.type = SEMICOLON; break; } token.lexeme[0] = ch; token.lexeme[1] = '\0'; return token; } int main() { FILE* fp = fopen("input.txt", "r"); Token token; if (fp == NULL) { printf("Error: Failed to open the input file.\n"); return 1; } while ((token = getNextToken(fp)).type != INVALID) { printf("Type: %d, Lexeme: %s\n", token.type, token.lexeme); } fclose(fp); return 0; } ``` 以上的代码实现了一个简单的词法分析器,能够识别整数、浮点数、标识符、运算符和分号。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值