使用lex分析java源程序

使用lex分析java源程序

    一般编译程序在进行词法分析的过程中都要将源程序中的无用符号及注释删除。虽然这个步骤并不复杂,用c语言就可以直接实现,但是如果用词法分析程序生成工具lex实现起来却可以更加方便。

       Lex美国Bell实验室用C语言研制的一个词法分析程序自生成工具

。它的基本原理就是使用正则表达式扫描匹配文本,并为每一个匹配模式定义一些操作,当用C语言作宿主语言时,这些操作都由C语言实现。

一种匹配的正则表达式可能会包含相关的动作。这一动作可能还包括返回一个标记。当 Lex 接收到文件或文本形式的输入时,它试图将文本与正则表达式进行匹配。它一次读入一个输入字符,直到找到一个匹配的模式。如果能够找到一个匹配的模式,Lex 就执行相关的动作(可能包括返回一个标记)。另一方面,如果没有可以匹配的正则表达式,将会停止进一步的处理,Lex 将显示一个错误消息。

Lex 和 C 是强耦合的。一个 .l 文件(Lex 文件具有 .l 的扩展名)通过 lex 公用程序来传递,并生成 C 的输出文件。这些文件被编译为词法分析器的可执行版本。

本程序对java源程序进行分析,主要实现以下两个功能:

(1)、清除注释。java源程序有三种注释方法:1、单行注释,以//开头直到行结束;2、多行注释,以/*为开始,*/为结束,可以注释多行;3、java文档注释,这也是一种多行注释,但它可以通过java文档生成工具写入java程序文档中。它以/**为开始,*/为结束。

(2)、通过程序行数计算工作量。

(3)、计算程序中类的个数,并判断有没有两个public类,如果存在则报错:There is an error:One java file cannot includes two public class。

单行注释的清除。由于单行注释以//开头直到行结束,首先要匹配的就是//,然后清除从匹配处到行结束的所有字符。具体实现如下:

"//" {

      int c;

      while ( (c = input()) != '/n' &&

         c != EOF )

      {

         ;

      }

      code = add(code,'/n');

   }

 

多行注释的清除。多行注释有两种,一种是普通多行注释,另一种是java文档注释。这两种注释都以*/结束,普通多行注释以/*开始,java文档注释以/**开始。可以先匹配/*,然后向后搜索*/。要区别这两种注释就要看/*后面是否紧跟一个*字符,如果不是则为普通多行注释;如果是还要看下一字符是否为/字符,如果是也为普通注释,如果不是则为java文档注释。具体lex程序实现如下:

"/*" {

        int c,ct=0;

        char * javadoc = "/*there is a Java Doc Comment*/";

        for ( ; ; )

       {

           while ( (c = input()) != '*' &&

              c != EOF )

           { <

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值