public static String takeOutHtmlTab(String htmlStr) {
// 定义script的正则表达式,去除js可以防止注入
String scriptRegex = "<script[^>]*?>[\\s\\S]*?<\\/script>";
// 定义style的正则表达式,去除style样式,防止css代码过多时只截取到css样式代码
String styleRegex = "<style[^>]*?>[\\s\\S]*?<\\/style>";
// 定义HTML标签的正则表达式,去除标签,只提取文字内容
String htmlRegex = "<[^>]+>";
// 定义空格,回车,换行符,制表符
String spaceRegex = "\\s*|\t|\r|\n";
// 过滤script标签
htmlStr = htmlStr.replaceAll(scriptRegex, "");
// 过滤style标签
htmlStr = htmlStr.replaceAll(styleRegex, "");
// 过滤html标签
htmlStr = htmlStr.replaceAll(htmlRegex, "");
// 过滤空格等
htmlStr = htmlStr.replaceAll(spaceRegex, "");
// 过滤
htmlStr = htmlStr.replace(" ", "");
// 过滤 
htmlStr = htmlStr.replace(" ", "");
// 返回文本字符串
htmlStr = htmlStr.trim();
// 去除空格" "
htmlStr = htmlStr.replaceAll(" ", "");
return htmlStr;
}
01-19
892
![](https://csdnimg.cn/release/blogv2/dist/pc/img/readCountWhite.png)
04-19
1497
![](https://csdnimg.cn/release/blogv2/dist/pc/img/readCountWhite.png)
“相关推荐”对你有帮助么?
-
非常没帮助
-
没帮助
-
一般
-
有帮助
-
非常有帮助
提交