词法分析器java语言_词法分析器java版(java词法分析器)

无论是词法分析,还是语法分析,给我的第一感觉就是逻辑要严谨。由于项目有自己一套完整的语言和语法,设计好其对应的词法分析器和语法分析器显得尤为重要。

这里给您提供一个免费的java词法分析器下载

java词法分析器实现原理步骤

先写其正则式,然后NFA,然后DFA,然后对其进行优化,最后准备工作做好了,就可以开始写代码了。

下面对其里面的主要函数进行讲解:

enum Token_Type {

keyword =1,              //关键字

Identifier,            //标识符

operatorr,             //运算符

operatorrd,             //单运算符

constant,              //常量

escape,                //转义符

separator,              //界限符

notype,                  //没有类型

zhushi                   //注释类型

};

对其单词的类型定义成枚举。

typedef struct Token {

Token_Type type; //其类型

char *lexeme ;    //字符串

int  value;       //属性值

}Token;

//返回单词的结构。

void InitScanner(char *ch){

fp1 = fopen(ch,"r+");

LineNo = 1;

}//初始化分析器。

void CloseScanner(){

fclose(fp1);

}//关闭分析器

void EmptyTokenString(){

memset(TokenBuffer,0,100);

}//清空缓冲区

static void AddCharTokenString(char Char)

{

int TokenLenth=strlen(TokenBuffer);

if(TokenLenth+1==sizeof(TokenBuffer)) return;

TokenBuffer[TokenLenth]=Char;

TokenBuffer[TokenLenth+1]='\0';

} //将一个字符添加到缓冲区

static char GetChar(){

char Char;

Char = fgetc(fp1);

return Char;

}//从文件中读取一个字符

static void BackChar(char Char) {

if(Char!=EOF){

ungetc(Char,fp1);

}

}//将其字符后退一个。

static Token JudgeKeyToken(char *IDstring);//这个函数实现对关键字进行判断

下面是源代码:

/************************************************************************

*                CopyRight@ice-snow studio                              *

*               email:bingxuefenggu@126.com                             *

*               qq: 405116890                                           *

************************************************************************/

//只考虑到整形常量

//实型没考虑到

//需要解决转义符如何描述的问题

#include

#include

#include

#include

#define TOKEN_LEN 100

enum Token_Type {

keyword =1,              //关键字

Identifier,            //标识符

operatorr,             //运算符

operatorrd,             //单运算符

constant,              //常量

escape,                //转义符

separator,              //界限符

notype,                  //没有类型

zhushi                   //注释类型

};

typedef struct Token {

Token_Type type; //其类型

char *lexeme ;    //字符串

int  value;       //属性值

}Token;

static Token Token_Tap[] = {

{keyword,"abstract",0x103},

{keyword,"boolean",0x103},

{keyword,"break", 0x103},

{keyword,"byte" ,0x103},

{keyword,"case",0x103},

{keyword,"catch",0x103},

{keyword,"char", 0x103},

{keyword, "class",0x103},

{keyword,"const" ,0x103},

{keyword,"continue" ,0x103},

{keyword,"default" , 0x103},

{keyword,"do",0x103},

{keyword,"double",0x103},

{keyword,"else",0x103},

{keyword,"extends",0x103},

{keyword,"false",0x103},

{keyword,"final",0x103},

{keyword,"finally",0x103},

{keyword,"float",0x103},

{keyword,"for",0x103},

{keyword,"goto",0x103},

{keyword,"if",0x103},

{keyword,"implements",0x103},

{keyword,"import",0x103},

{keyword,"instanceof",0x103},

{keyword,"int",0x103},

{keyword,"interface",0x103},

{keyword,"long",0x103},

{keyword,"native",0x103},

{keyword,"new",0x103},

{keyword,"null",0x103},

{keyword,"package",0x103},

{keyword,"private",0x103},

{keyword,"protected",0x103},

{keyword,"public",0x103},

{keyword,"return",0x103},

{keyword,"short",0x103},

{keyword,"static",0x103},

{keyword,"super",0x103},

{keyword,"switch",0x103},

{keyword,"synchronized",0x103},

{keyword,"this",0x103},

{keyword,"throw",0x103},

{keyword,"throws",0x103},

{keyword,"transient",0x103},

{keyword,"true",0x103},

{keyword,"try", 0x103},

{keyword,"void",0x103},

{keyword,"volatile",0x103},

{keyword,"while",0x103},

{constant,"true",0x105},

{constant,"false",0x105}

//以上是所有的关键字

};

FILE *fp1;// 要读文件的描述符

int LineNo;//单词所在的行数

static char TokenBuffer[TOKEN_LEN];//单词符号的缓存区

void InitScanner(char *ch){

fp1 = fopen(ch,"r+");

LineNo = 1;

}

void CloseScanner(){

fclose(fp1);

}

void EmptyTokenString(){

memset(TokenBuffer,0,100);

}

static void AddCharTokenString(char Char)

{

int TokenLenth=strlen(TokenBuffer);

if(TokenLenth+1==sizeof(TokenBuffer)) return;

TokenBuffer[TokenLenth]=Char;

TokenBuffer[TokenLenth+1]='\0';

}

static char GetChar(){

char Char;

Char = fgetc(fp1);

return Char;

}

static void BackChar(char Char) {

if(Char!=EOF){

ungetc(Char,fp1);

}

}

static Token JudgeKeyToken(char *IDstring){

int loop;

Token token;

for(loop=0;loop<51;loop++){

if(strcmp(Token_Tap[loop].lexeme,IDstring)==0)

return Token_Tap[loop];

}

token.type = Identifier;

//strcpy(token.lexeme,IDstring);//youwenti.

token.lexeme = IDstring;

token.value = 0x104;

return token;

}

PC官方版

安卓官方手机版

IOS官方手机版

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
1.根据状态转换图直接编程 编写一个词法分析程序,它从左到右逐个字符的对源程序进行扫描,产生一个个的单词的二元式,形成二元式(记号)流文件输出。在此,词法分析程序作为单独的一遍,如下图所示。 具体任务有: (1)组织源程序的输入 (2)识别单词的类别并记录类别编号和值,形成二元式输出,得到单词流文件 (3)删除注释、空格和无用符号 (4)发现并定位词法错误,需要输出错误的位置在源程序中的第几行。将错误信息输出到屏幕上。 (5)对于普通标识符和常量,分别建立标识符表和常量表(使用线性表存储),当遇到一个标识符或常量时,查找标识符表或常量表,若存在,则返回位置,否则返回0并且填写符号表或常量表。 标识符表结构:变量名,类型(整型、实型、字符型),分配的数据区地址 注:词法分析阶段只填写变量名,其它部分在语法分析、语义分析、代码生成等阶段逐步填入。 常量表结构:常量名,常量值 单词的构词规则: 字母=[A-Z a-z] 数字=[0-9] 标识符=(字母|_)(字母|数字|_)* 数字=数字(数字)*( .数字+|) 2.S语言表达式和语句说明 1.算术表达式:+、-、*、/、% 2.关系运算符:>、>=、<、<=、==、!= 3.赋值运算符:=,+=、-=、*=、/=、%= 4.变量说明:类型标识符 变量名表; 5.类型标识符:int char float 6.If语句:if 表达式then 语句 [else 语句] 7.For语句:for(表达式1;表达式2;表达式3) 语句 8.While语句:while 表达式 do 语句 9.S语言程序:由函数构成,函数不能嵌套定义。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值