编写一个词法分析,对于输入的一段程序,可以获取该程序的单词符号。

编写一个程序,对于输入的一段程序,可以获取该程序的单词符号。单词符号的类别有基本字、标识符、常数、算符和界符。关键字为基本字,由字母组成,如intforwhile;变量名和函数名为标识符,由字母和数字构成,如fun1age;固定不变的数值为常数,如1213.8625e8(科学计数法);算符如+-*/%&&;界符如{[(、 ;和:等。

 如,若输出源程序如下,

public static void main (String [] args) { 
    double sum5 = 0.0;
for ( int i=1;i<5;i++) {
sum5=sum5+(i+10);
sum5=sum5+(i*2);
    }
}


则输出如下,

public 基本字

static 基本字

void 基本字

main 标识符

( 界符

String基本字

[ 界符

] 界符

args标识符

)  界符

{ 界符
double基本字

sum5标识符

= 算符

0.0 常数

; 界符

for基本字

( 界符

int 基本字

i标识符

=算符

1常数

; 界符

i标识符

<算符

5常数

; 界符

i标识符

++算符

)  界符

{ 界符

sum5 标识符

= 算符

sum5 标识符

+ 算符

(界符

i标识符

+ 算符

10常数

) 界符

; 界符

sum5 标识符

= 算符

sum5 标识符

+  算符

(界符

i 标识符

*  算符

2常数

) 界符

;  界符

}界符
}界符

 

提示,要想写出满足上述要求的词法分析器,需要有三个步骤。

(1) 了解该语言的单词符号

(2) 为单词符号构对应造状态转换图。状态转换图的构造可以参考课本P41(3.2)P43(3.3)

(3) 根据状态转图的结构进行计算机实现。


Java代码解决:

package Bianyiyuanli.ThirdWeek;

import java.util.Arrays;
import java.util.List;
import java.util.Scanner;

public class Word {

	static Scanner sc = new Scanner(System.in);

	// 保存关键字
	private static List<String> KeyWords;
	// 保存操作符
	private static List<String> Operators;
	// 保存界符
	private static List<String> Boundarys;

	private static List<String> Spaces;
	// 初始化
	static {
		// 关键字数组 --> 关键字列表
		String[] keywordArr = { "public", "private", "protected", "short",
				"int", "long", "char", "float", "double", "boolean", "static",
				"void", "for" };
		KeyWords = Arrays.asList(keywordArr);

		// 操作符数组 --> 操作符列表
		String[] operatorArr = { "+", "-", "*", "/", "%", "=", ">", "<", "&" };
		Operators = Arrays.asList(operatorArr);

		// 界符数组 --> 界符列表
		String[] boundaryArr = { "" + '{', "" + '}', "" + '[', "" + ']',
				"" + '(', "" + ')', "" + ';' };
		Boundarys = Arrays.asList(boundaryArr);

		// 空格字符数组 --> 空格字符列表
		String[] SpaceArr = { " ", "\t", "\n" };
		Spaces = Arrays.asList(SpaceArr);
	}
	static boolean isDelimiter = false;//是否有分隔符

	// 字符串缓冲
	static StringBuffer strb = new StringBuffer();

	public static void main(String[] args) {
		
		String inStr = "";
		// 1.获取字符串
		while (!sc.hasNext("---")) {
			inStr = sc.nextLine();
			inStr = inStr + " ";
			for (char ch : inStr.toCharArray()) {
				match(ch);
			}
		}
			}

	static void match(char ch) {
		// 分割符缓冲
		StringBuffer bouStrb = new StringBuffer();
		// 1. 判断字符类型
		/**
		 * (空格|操作符|界符)都是(关键字|标识符|数字)的分割符
		 * 即,任意两个(关键字|标识符|数字)之间不可直接相连,而无分割符(空格|操作符|界符)
		 */
		// 1.0 空格,返回空格
		if (Spaces.indexOf(ch + "") >= 0) {
			isDelimiter = true;
		}
		// 1.1. 操作符, 返回"operator"
		if (Operators.indexOf(ch + "") >= 0) {
			isDelimiter = true;
			bouStrb = new StringBuffer(ch + " 是操作符");
		}
		// 1.2 界符, 返回"boundary"
		if (Boundarys.indexOf(ch + "") >= 0) {
			isDelimiter = true;
			bouStrb = new StringBuffer(ch + " 是界符");
		}
		// 2. 如果是分割符,
		/**
		 * 判断strb中有缓冲字符串, 2.1 若有,检查其是不是常数(暂不接受负数) 2.1.1 若是, 输出字符串,
		 * 并标识该字符串为constant 2.1.2 若不是, 检查在不在关键字表中, 2.1.2.1 若在,
		 * 输出字符串,并标识该字符串为keyword 2.1.2.2 若不在, 输出字符串,并标识该字符串为identifier
		 * 
		 * 还原变量初始设置,并退出
		 */
		if (isDelimiter) {
			if (strb.length() > 0) {
				if (strb.charAt(0) >= '0' && strb.charAt(0) <= '9') {
					System.out.println(strb + " 是常数");

				} else if (KeyWords.indexOf(strb.toString()) >= 0) {
					System.out.println(strb + " 是关键字");
				} else {
					System.out.println(strb + "是标识符 ");
				}
			}
			if (bouStrb.length() > 0)
				System.out.println(bouStrb);
			strb.setLength(0);
			isDelimiter = false;
			return;
		}

		// 3. 进行到该步,说明字符不是分割符,则把该字符追加到strb中即可
		strb.append(ch);

	}

}



实验一:词法分析 一、实验目的 通过设计一个具体的词法分析程序,加深对词法分析原理的理解。并掌握在对程序设计语言源程序进行扫描过程中将其分解为各类单词词法分析方法。 编制一个单词过程,从输入的源程序中,识别出各个具有独立意义的单词,即基本保留字、标识符、常数、运算符、分隔符五大类。并依次输出各个单词的内部编码及单词符号自身值。 二、实验预习提示 1、 词法分析器的功能和输出格式 词法分析器的功能是输入程序,输出单词符号词法分析器的单词符号常常表示成以下的二元式(单词种别码,单词符号的属性值)。本实验中,采用的是一类符号对应一个种别码的方式。 2、 单词的BNF表示 ----> ----> ----> + ----> - 等等 3、 模块结构(见课本P95-96)(可根据自己的理解适当修改) 三、实验过程和指导: (一) 准备: 1. 阅读课本有关章节,明确语言的语法,写出基本保留字、标识符、常数、运算符、分隔符和程序例。 2. 初步编制好程序。 3. 准备好多组测试数据。 (二) 上机: (三) 程序要求: 1. 要求用C++Builder或者Dephi或者VC、VB等可视化编程工具编写;要求有界面(即一般windows下应用程序界面)。 2. 输入为某语言源代码。 程序输入/输出示例: 如源程序为C语言。输入如下一段: main() { int a,b; a=10; b=a+20; } 要求输出如下(并以文件形式输出)。 (2,”main”) (5,”(“) (5,”)“) (5,”{“} (1,”int”) (2,”a”) (5,”,”) (2,”b”) (5,”;”) (2,”a”) (4,”=”) (3,”10”) (5,”;”) (2,”b”) (4,”=”) (2,”a”) (4,”+”) (3,”20”) (5,”;”) (5,”}“) 注:为右大括号 要求(可根据实际情况加以扩充和修改): 识别保留字:if、int、for、while、do、return、break、continue等等,单词种别码为1。 其他的标识符,单词种别码为2。 常数为无符号数,单词种别码为3。 运算符包括:+、-、*、/、=、>、=、<=、!= ;单词种别码为4。 分隔符包括: “,”“;”“(”“)”“{”“}”等等, 单词种别码为5。 (四) 程序思路(仅供参考): 0. 定义部分:定义常量、变量、数据结构。 1. 初始化:从文件将源程序输入到字符缓冲区中。 2. 取单词前:去掉多余空白。调用过程GETNB(); 3. 提取字符组成单词,利用课本P97图4.5转换图构造单词扫描过程SCAN(),需要根据实际情况加以修改。 4. 判断单词的种别码,调用过程LOOKUP(); 5. 显示(导出)结果。
实验二 词法分析器 一、实验目的 掌握词法分析器的构造原理,掌握手工编程或LEX编程方法之一。 二、实验内容 编写一个LEX源程序,使之生成一个词法分析器,能够输入的源程序转换为单词序列输出。 三、实验环境 Flex+VC6.0 四、实验注意 1.Id正则表达式:{letter}({letter}|{digit})* 2.Num正则表达式:{digit}+(\.{digit}+)?(E[+-]?{digit}+)? 3.注释:(\/\*(.)*\*\/) 4.关键字再加上其他字符就又能编程id,所以在词法分析时,id的判断应该放在关键字前面,这样才不会误判 5.由于本程序知识简单的打印数字,因此没有考虑数字的转换 6.">="比">"多一个字符,它应该放在前面判断,其他类似的也应该如此安排 五、实验代码 ******************************************************************************* 实验文件:lex.l、lex.yy.c 实验结果:lex.exe 运行方式:打开lex.exe,弹出input.txt,在其中输入所要测试的程序,保存并关闭,即可在output.txt中看到所得结果 ******************************************************************************* %{ void Install(char *type); %} %option noyywrap delim [ \t] newline [\n] digit [0-9] num {digit}+(\.{digit}+)?(E[+-]?{digit}+)? letter [A-Za-z] id {letter}({letter}|{digit})* key ("if"|"while"|"do"|"break"|"true") basic ("int"|"float"|"bool"|"char") op (">="|""|"<"|"="|"!="|"+"|"-"|"*"|"/") comment (\/\*(.)*\*\/) %% delim {;} newline {printf("\n");} {num} {Install("Num");} {key} {Install("Key");} {basic} {Install("Basic");} {op} {Install("Op");} ";" {Install("Comma");} {id} {Install("ID");} {comment} {Install("Comment");} "(" | "[" | "{" {Install("lbracket");} ")" | "]" | "}" {Install("rbracket");} %% void Install(char *s) { fprintf(yyout, "%s:%s ", s, yytext); } int main() { printf("please input the test program in input.txt\n"); system("input.txt"); yyin = fopen("input.txt", "r"); yyout = fopen("output.txt", "w" ); yylex(); fclose(yyout); fclose(yyin); printf("analysis result in output.txt\n"); system("output.txt"); return 0; } 六、实验小结 本次的实验由于使用了flex,所以代码较短,麻烦的事flex的正则式表达,由于该使用规则只有简单介绍,而网上找的教程难免有比重就轻之嫌,所以得到上述表达式着实费力,且有的没有成功,例如bracket的(\ ((.)*\ ))或者("("(.)*")")使用时都没有成功,所以便单独写出,有点不伦不类。至于其他的,都较为简单,完。
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

tiki_taka_

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值