// 1、过滤掉所有script脚本的正则:
content.replaceAll("<script[^>]*?>[\\s\\S]*?<\\/script>", "")
// 2、过滤掉所有style的正则:
content.replaceAll("<[\\s]*?style[^>]*?>[\\s\\S]*?<[\\s]*?\\/[\\s]*?style[\\s]*?>", "");
// 滤掉所有html标签,保留p和br标签。
content.replaceAll("</?(?!br|/?p)[^>]*>", "");
// 4、指定字符串去重
content = content.replaceAll("(?s)(\r\n)(?=[\r|\n]*\\1)", "");
// 5、字符串去重
content = content.replaceAll("(?s)(.)(?=.*\\1)", "");
/* (?s) 开启单行模式 DOTALL 让. 号匹配任意字符
(.) 任意字符 并捕获在第一组
(?=.*\1) 这是断言, 表示后面内容将是 任意个字符加上第一组所捕获的内容
这样子,如果这整个式子匹配到,表示,第一个捕获组内容在字符串中,至少出现两次,替换为 "" 空串. */
正则表达式过滤
最新推荐文章于 2024-05-16 18:22:18 发布