java 去掉字符串中的注释,java – 如何匹配注释,除非它在带引号的字符串中？...

最新推荐文章于 2023-04-20 15:40:26 发布

余女士

最新推荐文章于 2023-04-20 15:40:26 发布

阅读量262

点赞数

文章标签： java 去掉字符串中的注释

所以我有一些字符串：

//Blah blah blach

// sdfkjlasdf

"Another //thing"

我正在使用java正则表达式替换所有具有双斜杠的行,如下所示：

theString = Pattern.compile("//(.*?)\\n", Pattern.DOTALL).matcher(theString).replaceAll("");

它在很大程度上起作用,但问题是它删除了所有的事件,我需要找到一种方法让它不删除引用的事件.我该怎么做呢？

解决方法:

您可以使用一些第三方工具(如ANTLR),而不是使用解析整个Java源文件的解析器,或者自己编写仅解析您感兴趣的部分的解析器.

ANTLR只能定义您感兴趣的令牌(当然还有令牌流可能会像多行注释和字符串和字符串文字一样).因此,您只需要定义一个正确处理这些标记的词法分析器(标记器的另一个单词).

这称为语法.在ANTLR中,这样的语法可能如下所示：

lexer grammar FuzzyJavaLexer;

options{filter=true;}

SingleLineComment

: '//' ~( '\r' | '\n' )*

;

MultiLineComment

: '/*' .* '*/'

;

StringLiteral

: '"' ( '\\' . | ~( '"' | '\\' ) )* '"'

;

CharLiteral

: '\'' ( '\\' . | ~( '\'' | '\\' ) )* '\''

;

将上述内容保存在名为FuzzyJavaLexer.g的文件中.现在download ANTLR 3.2 here并将其保存在与FuzzyJavaLexer.g文件相同的文件夹中.

执行以下命令：

java -cp antlr-3.2.jar org.antlr.Tool FuzzyJavaLexer.g

这将创建一个FuzzyJavaLexer.java源类.

当然你需要测试词法分析器,你可以通过创建一个名为FuzzyJavaLexerTest.java的文件并在其中复制下面的代码来完成：

import org.antlr.runtime.*;

public class FuzzyJavaLexerTest {

public static void main(String[] args) throws Exception {

String source =

"class Test { \n"+

" String s = \" ... \\\" // no comment \"; \n"+

" /* \n"+

" * also no comment: // foo \n"+

" */ \n"+

" char quote = '\"'; \n"+

" // yes, a comment, finally!!! \n"+

" int i = 0; // another comment \n"+

"} \n";

System.out.println("===== source =====");

System.out.println(source);

System.out.println("==================");

ANTLRStringStream in = new ANTLRStringStream(source);

FuzzyJavaLexer lexer = new FuzzyJavaLexer(in);

CommonTokenStream tokens = new CommonTokenStream(lexer);

for(Object obj : tokens.getTokens()) {

Token token = (Token)obj;

if(token.getType() == FuzzyJavaLexer.SingleLineComment) {

System.out.println("Found a SingleLineComment on line "+token.getLine()+

", starting at column "+token.getCharPositionInLine()+

", text: "+token.getText());

}

接下来,通过执行以下操作编译FuzzyJavaLexer.java和FuzzyJavaLexerTest.java：

javac -cp .:antlr-3.2.jar *.java

最后执行FuzzyJavaLexerTest.class文件：

// *nix/MacOS

java -cp .:antlr-3.2.jar FuzzyJavaLexerTest

要么：

// Windows

java -cp .;antlr-3.2.jar FuzzyJavaLexerTest

之后,您将看到以下内容被打印到您的控制台：

===== source =====

class Test {

String s = " ... \" // no comment ";

* also no comment: // foo

char quote = '"';

// yes, a comment, finally!!!

int i = 0; // another comment

}

==================

Found a SingleLineComment on line 7, starting at column 2, text: // yes, a comment, finally!!!

Found a SingleLineComment on line 8, starting at column 13, text: // another comment

很简单,嗯？

标签：java,regex,parsing,regex-negation

来源： https://codeday.me/bug/20190610/1213837.html

余女士

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫