小C语言--词法分析程序
Description
小C语言文法
1. <程序>→<main关键字>(){<声明序列><语句序列>}
2. <声明序列>→<声明序列><声明语句>|<声明语句>|<空>
3. <声明语句>→<标识符表>;
4. <标识符表>→<标识符>,<标识符表>|<标识符>
5. <语句序列>→<语句序列><语句>|<语句>
6. <语句>→< if语句>|< while语句>|< for语句>|<复合语句>|<赋值语句>
7. < if语句>→< if关键字>(<表达式>)<复合语句>|(<表达式>)<复合语句>< else关键字><复合语句>
8. < while语句>→< while关键字>(<表达式>)<复合语句>
9. < for语句>→< for关键字>(<表达式>;<表达式>;<表达式>)<复合语句>
10. <复合语句>→{<语句序列>}
11. <赋值语句>→<表达式>;
12. <表达式>→<标识符>=<算数表达式>|<布尔表达式>
13. <布尔表达式>→<算数表达式> |<算数表达式><关系运算符><算数表达式>
14. <关系运算符>→>|<|>=|<=|==|!=
15. <算数表达式>→<算数表达式>+<项>|<算数表达式>-<项>|<项>
16. <项>→<项>*<因子>|<项>/<因子>|<因子>
17. <因子>→<标识符>|<无符号整数>|(<算数表达式>)
18. <标识符>→<字母>|<标识符><字母>|<标识符><数字>
19. <无符号整数>→<数字>|<无符号整数><数字>
20. <字母>→a|b|…|z|A|B|…|Z
21. <数字>→0|1|2|3|4|5|6|7|8|9
22. < main关键字>→main
23. < if关键字>→if
24. < else关键字>→else
25. < for关键字>→for
26. < while关键字>→while
27. < int关键字>→int
每行单词数不超过10个
小C语言文法如上,现在我们对小C语言写的一个源程序进行词法分析,分析出关键字、自定义标识符、整数、界符
和运算符。
关键字:main if else for while int
自定义标识符:除关键字外的标识符
整数:无符号整数
界符:{ } ( ) , ;
运算符:= + - * / < <= > >= == !=
Input
输入一个小C语言源程序,源程序长度不超过2000个字符,保证输入合法。
Output
按照源程序中单词出现顺序输出,输出二元组形式的单词串。
(单词种类,单词值)
单词一共5个种类:
关键字:用keyword表示
自定义标识符:用identifier表示
整数:用integer表示
界符:用boundary表示
运算符:用operator表示
每种单词值用该单词的符号串表示。
Input
main()
{
int a, b;
if(a == 10)
{
a = b;
}
}
Output
(keyword,main)
(boundary,()
(boundary,))
(boundary,{)
(keyword,int)
(identifier,a)
(boundary,,)
(identifier,b)
(boundary,;)
(keyword,if)
(boundary,()
(identifier,a)
(operator,==)
(integer,10)
(boundary,))
(boundary,{)
(identifier,a)
(operator,=)
(identifier,b)
(boundary,;)
(boundary,})
(boundary,})
oj不能带注释,先上AC代码
import java.util.*;
public class Main {
static String[] a = {"keyword", "identifier", "integer", "boundary", "operator"};
static String[] b = {"main", "if", "else", "for", "while", "int"};
public static void main(String[] args) {
Scanner in = new Scanner(System.in);
while (in.hasNext()) {
String s = in.next();
String kong = "";
char[] c = s.toCharArray();
for (int i = 0; i < c.length; i++) {
if (c[i] == '='
|| c[i] == '+'
|| c[i] == '-'
|| c[i] == '*'
|| c[i] == '/'
|| c[i] == '!'
|| c[i] == '<'
|| c[i] == '>') {
if (!kong.isEmpty()) {
pd(kong);
}
kong = "";
if (i + 1 < c.length && c[i + 1] == '=') {
System.out.println("(" + a[4] + "," + c[i] + c[i + 1] + ")");
i++;
} else {
System.out.println("(" + a[4] + "," + c[i] + ")");
}
} else if (c[i] == '('
|| c[i] == ')'
|| c[i] == '{'
|| c[i] == '}'
|| c[i] == ','
|| c[i] == ';') {
if (!kong.isEmpty()) {
pd(kong);
}
kong = "";
System.out.println("(" + a[3] + "," + c[i] + ")");
} else {
kong = kong + c[i];
}
}
if(!kong.isEmpty()){
pd(kong);
}
}
}
public static void pd(String kong) {
char[] k = kong.toCharArray();
if (k[0] >= '0' && k[0] <= '9') {
System.out.println("(" + a[2] + "," + kong + ")");
} else {
int m = 1;
for (String n : b) {
if (kong.equals(n)) {
System.out.println("(" + a[0] + "," + kong + ")");
m = 0;
break;
}
}
if (m == 1) {
System.out.println("(" + a[1] + "," + kong + ")");
}
}
}
}
注释版代码,方便理解
import java.util.*;
public class Main {
//创建一个全局字符串数组,用于存放关键字、自定义标识符、整数、界符和运算符
static String[] a = {"keyword", "identifier", "integer", "boundary", "operator"};
//创建一个全局字符串数组,用于存放关键字字符串
static String[] b = {"main", "if", "else", "for", "while", "int"};
public static void main(String[] args) {
Scanner in = new Scanner(System.in);
//循环输入,当还有输入的时候,循环不停止
while (in.hasNext()) {
//创建字符串s用于存放输入的字符数组,用.next()不计入空格,遇到空格和回车判断为此字符串输入完成
String s = in.next();
//创建一个空串,用于后续临时存放需要判断的字符串
String kong = "";
//将输入的字符串转为字符数组形式
char[] c = s.toCharArray();
//循环遍历字符数组
for (int i = 0; i < c.length; i++) {
//第一重判断,用于判断出加减乘除等符号,建议从第三重判断结合下面的pd方法开始理解
if (c[i] == '='
|| c[i] == '+'
|| c[i] == '-'
|| c[i] == '*'
|| c[i] == '/'
|| c[i] == '!'
|| c[i] == '<'
|| c[i] == '>') {
//遇到运算符后,如果字符串不是空的,则传入pd方法判断输出,相当于是以运算符为界,判断前面的字符串有什么
if (!kong.isEmpty()) {
pd(kong);
}
//判断完成后,字符串重置为空串,方便后续判断
kong = "";
//以下是判断出>=等两运算符的操作
if (i + 1 < c.length && c[i + 1] == '=') {
System.out.println("(" + a[4] + "," + c[i] + c[i + 1] + ")");
i++;
} else {
System.out.println("(" + a[4] + "," + c[i] + ")");
}//第二重判断,用于判断出界符,里面的操作跟第一重差不多
} else if (c[i] == '('
|| c[i] == ')'
|| c[i] == '{'
|| c[i] == '}'
|| c[i] == ','
|| c[i] == ';') {
if (!kong.isEmpty()) {
pd(kong);
}
kong = "";
System.out.println("(" + a[3] + "," + c[i] + ")");
} else {//此处为第三重判断,如果没遇到运算符和界符,则向空串中存入字符
kong = kong + c[i];
}
}
//此操作用于判断剩下的字符串,不可省略
if(!kong.isEmpty()){
pd(kong);
}
}
}
//创建pd方法,用于判断输出非界符、运算符字符串
public static void pd(String kong) {
//将传入的字符串转化为字符数组
char[] k = kong.toCharArray();
//如果字符数组的第一个字符为数字,则可判定此字符串为纯数字字符串,可以直接输出(因为next())
if (k[0] >= '0' && k[0] <= '9') {
System.out.println("(" + a[2] + "," + kong + ")");
} else {
//以下为字符串不是数字的情况
//标志字符
int m = 1;
//遍历b数组进行比较,注意字符串对比只能用.equals(),==号默认比地址不能用
for (String n : b) {
if (kong.equals(n)) {
System.out.println("(" + a[0] + "," + kong + ")");
m = 0;
break;
}
}
//如果m=1,则说明不是关键字等也不是数字,只能是自己定义的字符
if (m == 1) {
System.out.println("(" + a[1] + "," + kong + ")");
}
}
}
}