编译原理—词法分析器

import java.io.*;
import java.util.*;

/**
 * 词法分析器
 *
 * 1.关键字: abstract boolean break byte case catch char class continue
 * default do double else extends final finally float for if implements import
 * instanceof int interface long native new package private protected public
 * return short static super switch synchronized this throw throws transient try
 * void volatile while
 *
 * 2.标识符
 *
 * 3. 常数
 *
 * 4.运算符包括:+、-、*、/、=、>、<
 *
 * 5.分隔符包括:, ; { } ( ) [ ]
 *
 * 程序过程: 0.定义部分:定义常量、变量、数据结构。
 *
 * 1.初始化:从文件将源程序全部输入到字符缓冲区中。
 *
 * 2.取单词前:去掉多余空白。
 *
 * 3.取单词后:去掉多余空白(可选,看着办)。
 *
 * 4.取单词:读出单词的每一个字符,组成单词,分析类型。(关键是如何判断取单词结束?取到的单词是什么类型的单词?)
 *
 * 5.显示结果。
 */

public class Analyzer {

 private String keyWords[] = { "abstract", "boolean", "break", "byte",
   "case", "catch", "char", "class", "continue", "default", "do",
   "double", "else", "extends", "final", "finally", "float", "for",
   "if", "implements", "import", "instanceof", "int", "interface",
   "long", "native", "new", "package", "private", "protected",
   "public", "return", "short", "static", "super", "switch",
   "synchronized", "this", "throw", "throws", "transient", "try",
   "void", "volatile", "while" }; // 关键字数组
 private char operators[] = { '+', '-', '*', '/', '=', '>', '<', '&' }; // 运算符数组
 private char separators[] = { ',', ';', '{', '}', '(', ')','[',']','_',':','、','.' ,'"'}; // 分隔符数组
 private String fileSrcName; // 源程序名
 private StringBuffer buffer = new StringBuffer(); // 缓冲区
 private char ch; // 字符变量,存放最新读进的源程序字符
 private static int i = 0;
 private String strToken; // 字符数组,存放构成单词符号的字符串
 private HashSet<String> retKeyWords = new HashSet<String>(); // 1.关键字结果
 private HashSet<String> retIds = new HashSet<String>(); // 2.标识符结果
 private HashSet<Integer> retConsts = new HashSet<Integer>(); // 3.常数结果
 private HashSet<Character> retOperators = new HashSet<Character>(); // 4.运算符结果
 private HashSet<Character> retSeparators = new HashSet<Character>(); // 5.分隔符结果

 /**
  * 构造方法
  */
 public Analyzer() {

 }

 public Analyzer(String fileSrcName) {
  this.fileSrcName = fileSrcName;
 }

 /**
  * 将下一个输入字符读到ch中,搜索指示器前移一个字符
  */
 public void getChar() {
  ch = buffer.charAt(i);
  i++;
 }

 /**
  * 检查ch中的字符是否为空白,若是则调用getChar() 直至ch中进入一个非空白字符
  */
 public void getBc() {
//  while (ch == ' ' || ch == '/t' || ch == '/n') { // 检查ch中的字符是否为空白
//   getChar();
//  }
  while(Character.isSpaceChar(ch))
   getChar();
 }

 /**
  * 将ch连接到strToken之后
  */
 public void concat() {
  strToken += ch;
 }

 /**
  * 判断字符是否为字母
  */
 boolean isLetter() {
//  if ((ch >= 'a' && ch <= 'z' || ch >= 'A' && ch <= 'Z'))
//   return true;
  if(Character.isLetter(ch))
   return true;
  return false;
 }

 /**
  * 判断字符是否为数字
  */
 boolean isDigit() {
//  if (ch >= '0' && ch <= '9')
//   return true;
  if(Character.isDigit(ch))
   return true;
  return false;
 }

 /**
  * 将搜索指示器回调一个字符位置,将ch值为空白字
  */
 public void retract() {
  i--;
  ch = ' ';
 }

 /**
  * 判断单词是否为关键字
  */
 public boolean isKeyWord() {

  for (int i = 0; i < keyWords.length; i++) {
   if (keyWords[i].equals(strToken))
    return true;
  }
  return false;
 }

 /**
  * 判断是否为运算符
  */
 public boolean isOperator() {
  for (int i = 0; i < operators.length; i++) {
   if (ch == operators[i])
    return true;
  }
  return false;
 }

 /**
  * 判断是否为分隔符
  */
 public boolean isSeparators() {
  for (int i = 0; i < separators.length; i++) {
   if (ch == separators[i])
    return true;
  }
  return false;
 }

 /**
  * 将strToken插入到关键字表
  */
 public void insertKeyWords(String strToken) {
  retKeyWords.add(strToken);
 }

 /**
  * 将strToken插入到符号表
  */
 public void insertId(String strToken) {
  retIds.add(strToken);
 }

 /**
  * 将strToken中的常数插入到常数表中
  */
 public void insertConst(String strToken) {
  int num = Integer.parseInt(strToken);
  retConsts.add(num);
 }

 /**
  * 将ch插入到运算符表中
  */
 public void insertOperators(char ch) {
  retOperators.add(ch);
 }

 /**
  * 将ch插入到分隔符表
  */
 public void insertSeparators() {
  retSeparators.add(ch);
 }

 /**
  * 将源程序读入到缓冲区中
  */
 public void readFile() {
  try {
   FileReader fis = new FileReader(this.fileSrcName);
   BufferedReader br = new BufferedReader(fis);
   String temp = null;
   while ((temp = br.readLine()) != null) {
    buffer.append(temp);
   }

  } catch (FileNotFoundException e) {
   System.out.println("源文件未找到!");
   e.printStackTrace();
  } catch (IOException e) {
   System.out.println("读写文件出现异常!");
   e.printStackTrace();
  }
 }

 /**
  * 词法分析
  */
 public void analyse() {
  boolean code, value;
  strToken = ""; // 置strToken为空串
  while (i < buffer.length()) {
   getChar();
   getBc();
   if (isLetter()) { // 如果ch为字母
    while (isLetter() || isDigit()) {
     concat();
     getChar();
    }
    retract(); // 回调
    code = isKeyWord(); // 判断strToken是否为关键字
    if (code) { // 如果是,则插入到1.保留字表中
     insertKeyWords(strToken);
    } else { // 否则插入到2.符号表中
     insertId(strToken);
    }
    strToken="";
   } else if (isDigit()) { // 如果ch为数字
    while (isDigit()) {
     concat();
     getChar();
    }
    retract(); // 回调
    insertConst(strToken); // 是常数,插入到3.常数表中
    strToken="";
   } else if (isOperator()) { // 如果是运算符,则插入到4.运算符表
    insertOperators(ch);
   } else if (isSeparators()) { // 如果是分隔符,插入到5.分隔符表中
    insertSeparators();
   }
    
   
  }

 }

 public static void main(String[] args) {

  /*
   * Scanner in = new Scanner(System.in);
   * System.out.println("请输入要分析的文件名:"); String fileName = in.next();
   */
  Analyzer alr = new Analyzer("F://java//Analisis//src//test.txt");
  alr.readFile();
  alr.analyse();

  System.out.println("词法分析器的分析结果如下:");
  System.out.println("1、关键字表");
  for (String key : alr.retKeyWords) {
   System.out.print(key + " ");
  }
  System.out.println();
  System.out.println("2、标识符表");
  for (String id : alr.retIds) {
   System.out.print(id + " ");
  }
  System.out.println();
  System.out.println("3、常数表");
  for (Integer con : alr.retConsts) {
   System.out.print(con + " ");
  }
  System.out.println();
  System.out.println("4、运算符表");
  for (Character operator : alr.retOperators) {
   System.out.print(operator + " ");
  }
  System.out.println();
  System.out.println("5、分隔符表");
  for (Character separator : alr.retSeparators) {
   System.out.print(separator + " ");
  }
 }

}

词法分析 一、实验目的: 通过设计编制调试一个具体的词法分析程序,加深对词法分析原理的理解。并掌握在对程序设计语言源程序进行扫描过程将其分解为各类单词的词法分析方法。 编制一个读单词过程,从输入的源程序,识别出各个具有独立意义的单词,即基本保留字、标识符、常数、运算符、分隔符五大类。并依次输出各个单词的内部编码及单词符号自身值。(遇到错误时可显示“Error”,然后跳过错误部分继续显示) 二、实验说明 1、 词法分析器的功能和输出格式 词法分析器的功能是输入源程序,输出单词符号。词法分析器单词符号常常表示成以下的二元式(单词种别码,单词符号的属性值)。本实验,采用的是一类符号一种别码的方式。 2、 单词的BNF表示 -> ->|| |ε -> -> |ε -> + -> - -> > -> >= 三、实验要求 (一)准备: 1.阅读课本有关章节,明确语言的语法,写出基本保留字、标识符、常数、运算符、分隔符和程序例。 2.初步编制好程序。 3.准备好多组测试数据。 (二)上课上机: 将源代码拷贝到机上调试,发现错误,再修改完善。 第二次上机调试通过。 (三)程序要求: 程序输入/输出示例: 如源程序为C语言。输入如下一段: main() { int a,b; a = 10; b = a + 20; } 要求输出如下: (2,”main”) (5,”(“) (5,”)“) (5,”{“) (1,”int”) (2,”a”) (5,”,”) (2,”b”) (5,”;”) (2,”a”) (4,”=”) (3,”10”) (5,”;”) (2,”b”) (4,”=”) (2,”a”) (4,”+”) (3,”20”) (5,”;”) (5,”}“) 要求: 识别保留字:if、int、for、while、do、return、break、continue; 单词种别码为1。 其他的都识别为标识符;单词种别码为2。 常数为无符号整形数;单词种别码为3。 运算符包括:+、-、*、/、=、>、=、<=、!= ; 单词种别码为4。 分隔符包括:,、;、{、}、(、); 单词种别码为5。 以上为参考,具体可自行增删。 (四)程序思路 这里以开始定义的C语言子集的源程序作为词法分析程序的输入数据。在词法分析,自文件头开始扫描源程序字符,一旦发现符合“单词”定义的源程序字符串时,将它翻译成固定长度的单词内部表示,并查填适当的信息表。经过词法分析后,源程序字符串(源程序的外部表示)被翻译成具有等长信息的单词串(源程序的内部表示),并产生两个表格:常数表和标识符表,它们分别包含了源程序的所有常数和所有标识符。 0.定义部分:定义常量、变量、数据结构。 1.初始化:从文件将源程序全部输入到字符缓冲区。 2.单词前:去掉多余空白。 3.单词后:去掉多余空白(可选,看着办)。 4.单词:利用实验一的成果读出单词的每一个字符,组成单词,分析类型。(关键是如何判断单词结束到的单词是什么类型的单词?)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值