一、任务概述
本项大作业将设计并实现一个Mini Java语言的编译器
Mini Java概述
Mini Java是Java语言的子集。作为一种很好的编译课程教学语言,它与Java相比做了如下精简:
(1)不允许重载(overloading)
(2)一个文件中可以申明若干个类,但必须有且只有一个的主类,辅类可以有多个,类不能申明为public;主类中只能有一个主方法,该方法的签名必须为“public static void main(String[])”,其中String[]参数不做处理。主方法中只能有一条输出语句:System.out.println( int ),该语句只能输出整型变量值
(3)只有类,没有接口,有继承关系(单继承)
(4)类中只能申明变量和方法
(5)只有四种变量类型:整型(integer)、布尔型(boolean)、数组(array)、对象;只有一类数组:整型数组(int[]);变量必须申明为(auto)型
(6)方法必须为public,必须有返回值,返回值类型受(5)限制;可以有参数,可以没有,参数数量没有限制,类型受(5)限制
(7)一共有6中语句(statement):代码块(block)、简单赋值语句(assignment statement)、数组赋值语句(array assignment statement)、打印语句(print statement)、if语句、while语句
(8)一共有9种表达式(expression):与(and)、比较(compare)、加(plus)、减(minus)、乘(times)、数组定位(array lookup)、数组长度(array length)、消息传递(message sending,即参数传递)、主表达式(primary expression);与表达式为“短路与”(&&);比较只能作小于比较
(9)主表达式一共有9种:整数(Integer)、“真”(true)、“假”(false)、对象、this、初始化(allocation)、数组初始化(array allocation)、非(not)、括号(bracket)
(10)初始化时只能使用空参数,所以没有“构造器(constructor)”概念
(11)对标识符(IDENTIFIER)没有作明确定义,在这里规定只能是字母、数字的集合,但必须以字母开头,区分大小写
(12)对整数(INTEGER_LITERAL)没有作明确定义,在这里规定为无符号整数,32位(0~4294967295)
(13)不允许注释
(14)类变量声明时不能初始化,初始化必须在方法中完成
(15)不能定义内部类
保留字、终结符
保留字 | 识别编码 | 记忆符 | 值 |
<EOF> | 0 | EOF | - |
boolean | 1 | BOOLEAN | - |
class | 2 | CLASS | - |
else | 3 | ELSE | - |
extends | 4 | EXTENDS | - |
fasle | 5 | FALSE | - |
if | 6 | IF | - |
int | 7 | INT | - |
length | 8 | LENGTH | - |
main | 9 | MAIN | - |
new | 10 | NEW | - |
public | 11 | PUBLIC | - |
return | 12 | RETURN | - |
static | 13 | STATIC | - |
this | 14 | THIS | - |
true | 15 | TRUE | - |
void | 16 | VOID | - |
while | 17 | WHILE | - |
String | 18 | STRING | - |
System.out.println | 19 | PRINTLN | - |
= | 20 | EQUAL | - |
! | 21 | NOT | - |
&& | 22 | AND | - |
+ | 23 | PLUS | - |
- | 24 | MINUS | - |
* | 25 | TIMES | - |
<
| 26 | COMPARE | - |
. | 27 | DOT | - |
; | 28 | SEMICOLON | - |
, | 29 | COMMA | - |
[ | 30 | LEFT_SQUARE | - |
] | 31 | RIGHT_SQUARE | - |
( | 32 | LEFT_BRACKET | - |
) | 33 | RIGHT_BRACKET | - |
{ | 34 | LEFT_BLOCK | - |
} | 35 | RIGHT_BLOCK | - |
标识符 | 36 | ID_STRING | 内部字符串 |
无符号整数 | 37 | ID_INTEGER | 整数值 |
本编译器概述
(1)语法分析程序用带回溯的递归子程序法
(2)对源文件进行两遍处理:第一遍词法分析,第二遍语法分析
(3)使用编译时静态分配存储空间
(4)整型数据类型32位,占4个字节;布尔型数据类型8位,占1个字节;内存(由列表虚拟)寻址10位,1KB
(5)为了实现方便,父类必须在子类之前定义
(6)由于时间原因,编译器做了如下简化:
(i)表达式只能处理加法、减法、乘法、小于比较、逻辑与,且只能对整数或布尔值直接进行计算,而不能计算变量的值
(ii)不能处理方法调用
(iii)不能处理数组
(iv)不能进行对象初始化
(v)不能处理结构化语句