编译原理词法分析器Java

package word;

import java.io.File;
import java.io.FileReader;

/**

  • 此程序是通过将文件的字符读取到字符数组中去,然后遍历数组,将读取的字符进行
  • 分类并输出
  • @author

*/

public class WordAnalyze {
// private String keyWord[] = {“break”,“include”,“begin”,“end”,“if”,“else”,“while”,“switch”};
private String keyWord[] = {“abstract”, “boolean”, “break”, “byte”,“case”, “catch”, “char”, “class”,
“continue”, “default”, “do”,“double”, “else”, “extends”, “final”, “finally”,
“float”, “for”,“if”, “implements”, “import”, “instanceof”, “int”, “interface”,
“long”, “native”, “new”, “package”, “private”, “protected”, “public”, “return”,
“short”, “static”, “super”, “switch”,“synchronized”, “this”, “throw”,“throws”,
“transient”, “try”,“void”,“volatile”,“while”,“strictfp”,
“enum”,“goto”,“const”,“assert”};
private char ch;
int KeeyWordNumber ;

//
// public static int printArray(int[] array,int value){
// for(int i = 0;i<array.length;i++){
// if(array[i]==value){
// return i;
// }
// }
// return -1;//当if条件不成立时,默认返回一个负数值-1
// }
//判断是否是关键字
int isKey(String str)
{
for(int i = 0;i < keyWord.length;i++)
{
if(keyWord[i].equals(str))
return i;

    }
    return -1;
}
//判断是否是字母
boolean isLetter(char letter)
{
    if((letter >= 'a' && letter <= 'z')||(letter >= 'A' && letter <= 'Z'))
        return true;
    else
        return false;
}
//判断是否是数字
boolean isDigit(char digit)
{
    if(digit >= '0' && digit <= '9')
        return true;
    else
        return false;
}
//词法分析
void analyze(char[] chars)
{
    String arr = "";
    for(int i = 0;i< chars.length;i++) {
        ch = chars[i];
        arr = "";
        if(ch == ' '||ch == '\t'||ch == '\n'||ch == '\r'){}
        else if(isLetter(ch)){
            while(isLetter(ch)||isDigit(ch)){    
                arr += ch;
                ch = chars[++i];
            }
            //回退一个字符
            i--;
            if(isKey(arr)!= -1){
                //关键字
                System.out.println(arr+"\t"+isKey(arr)+"\t关键字");
            }
            else{
                //标识符
                System.out.println(arr+"\t3"+"\t标识符");
            }
        }
        else if(isDigit(ch)||(ch == '.'))
        {
            while(isDigit(ch)||(ch == '.'&&isDigit(chars[++i])))
            {
                if(ch == '.') i--;
                arr = arr + ch;
                ch = chars[++i];
            }
            //属于无符号常数
            System.out.println(arr+"\t5"+"\t常数");
        }
        else switch(ch){
            //运算符
            case '+':System.out.println(ch+"\t2"+"\t运算符");break;
            case '-':System.out.println(ch+"\t2"+"\t运算符");break;
            case '*':System.out.println(ch+"\t2"+"\t运算符");break;
            case '/':System.out.println(ch+"\t2"+"\t运算符");break;
            //分界符
            case '(':System.out.println(ch+"\t3"+"\t分界符");break;
            case ')':System.out.println(ch+"\t3"+"\t分界符");break;
            case '[':System.out.println(ch+"\t3"+"\t分界符");break;
            case ']':System.out.println(ch+"\t3"+"\t分界符");break;
            case ';':System.out.println(ch+"\t3"+"\t分界符");break;
            case '{':System.out.println(ch+"\t3"+"\t分界符");break;
            case '}':System.out.println(ch+"\t3"+"\t分界符");break;
            //运算符
            case '=':{
                        ch = chars[++i];
                        if(ch == '=')System.out.println("=="+"\t2"+"\t运算符");
                        else {
                            System.out.println("="+"\t2"+"\t运算符");
                            i--;
                        }
                     }break;
            case ':':{
                        ch = chars[++i];
                        if(ch == '=')System.out.println(":="+"\t2"+"\t运算符");
                        else {
                            System.out.println(":"+"\t2"+"\t运算符");
                            i--;
                        }
                     }break;
            case '>':{
                        ch = chars[++i];
                        if(ch == '=')System.out.println(">="+"\t2"+"\t运算符");
                        else {
                            System.out.println(">"+"\t2"+"\t运算符");
                            i--;
                        }
                     }break;
            case '<':{
                        ch = chars[++i];
                        if(ch == '=')System.out.println("<="+"\t2"+"\t运算符");
                        else {
                            System.out.println("<"+"\t2"+"\t运算符");
                            i--;
                        }
                     }break;
            //无识别
            default: System.out.println(ch+"\t6"+"\t无识别符");
        }
    }
}

public static void main(String[] args) throws Exception {
File file = new File("./src/input.txt");//定义一个file对象,用来初始化FileReader
FileReader reader = new FileReader(file);//定义一个fileReader对象,用来初始化BufferedReader
int length = (int) file.length();
//这里定义字符数组的时候需要多定义一个,因为词法分析器会遇到超前读取一个字符的时候,如果是最后一个
//字符被读取,如果在读取下一个字符就会出现越界的异常
char buf[] = new char[length+1];
reader.read(buf);
reader.close();
new WordAnalyze().analyze(buf);

}
}
在这里插入图片描述
关键字可以自由修改添加,字符设置额外修整,整体框架已经给出
在这里插入图片描述
在这里插入图片描述

1.根据状态转换图直接编程 编写一个词法分析程序,它从左到右逐个字符的对源程序进行扫描,产生一个个的单词的二元式,形成二元式(记号)流文件输出。在此,词法分析程序作为单独的一遍,如下图所示。 具体任务有: (1)组织源程序的输入 (2)识别单词的类别并记录类别编号和值,形成二元式输出,得到单词流文件 (3)删除注释、空格和无用符号 (4)发现并定位词法错误,需要输出错误的位置在源程序中的第几行。将错误信息输出到屏幕上。 (5)对于普通标识符和常量,分别建立标识符表和常量表(使用线性表存储),当遇到一个标识符或常量时,查找标识符表或常量表,若存在,则返回位置,否则返回0并且填写符号表或常量表。 标识符表结构:变量名,类型(整型、实型、字符型),分配的数据区地址 注:词法分析阶段只填写变量名,其它部分在语法分析、语义分析、代码生成等阶段逐步填入。 常量表结构:常量名,常量值 单词的构词规则: 字母=[A-Z a-z] 数字=[0-9] 标识符=(字母|_)(字母|数字|_)* 数字=数字(数字)*( .数字+|) 2.S语言表达式和语句说明 1.算术表达式:+、-、*、/、% 2.关系运算符:>、>=、<、<=、==、!= 3.赋值运算符:=,+=、-=、*=、/=、%= 4.变量说明:类型标识符 变量名表; 5.类型标识符:int char float 6.If语句:if 表达式then 语句 [else 语句] 7.For语句:for(表达式1;表达式2;表达式3) 语句 8.While语句:while 表达式 do 语句 9.S语言程序:由函数构成,函数不能嵌套定义。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值