我碰到一个业务场景是需要验证index.html 里的一些信息,因此我写了一些查找逻辑。问题是总有一些注释影响判断。
通过研究最后浓缩为一行代码:
index = index.replaceAll("//[\\s\\S]*?\\n", "").replaceAll("/\\*{1,2}[\\s\\S]*?\\*/", "").replaceAll("<!-[\\s\\S]*?-->", "");
index 就是html的文本内容,这行代码就是为了替换掉三种常用的注释://,/**/,<!- -->
其中// 对应 "//[\\s\\S]*?\\n"
/**/对应 "/\\*{1,2}[\\s\\S]*?\\*/"
<!- -->对应 "<!-[\\s\\S]*?-->"
参考的文章: