private static final String regEx_script = "<[\\s]*?script[^>]*?>[\\s\\S]*?<[\\s]*?\\/[\\s]*?script[\\s]*?>"; //定义script的正则表达式
private static final String regEx_style = "<[\\s]*?style[^>]*?>[\\s\\S]*?<[\\s]*?\\/[\\s]*?style[\\s]*?>";//定义style的正则表达式
private static final String regEx_html = "<[^>]+>"; // 定义HTML标签的正则表达式
private static final String regEx_special = "\\&[a-zA-Z]{1,10};";// 定义一些特殊字符的正则表达式 如:
private static final String regEx_blank = "\\s*(\\r\\n|\\r|\\n|\\n\\r)\\s*";//定义回车换行符,以及前后的空白字符的正则表达式
public static String rePlaceAllHtml(String str) {
if(!StringUtil.isNullEmpty(str)){
Pattern p_html = Pattern.compile(regEx_script, Pattern.CASE_INSENSITIVE);
Matcher m_html = p_html.matcher(str);
str = m_html.replaceAll(""); // 过滤script
p_html = Pattern.compile(regEx_style, Pattern.CASE_INSENSITIVE);
m_html = p_html.matcher(str);
str = m_html.replaceAll(""); // 过滤style
p_html = Pattern.compile(regEx_html, Pattern.CASE_INSENSITIVE);
m_html = p_html.matcher(str);
str = m_html.replaceAll(""); // 过滤html标签
p_html = Pattern.compile(regEx_special, Pattern.CASE_INSENSITIVE);
m_html = p_html.matcher(str);
str = m_html.replaceAll(""); // 过滤特殊字符
return str;
}
return "";
}
/**
* 过滤html代码及回车换行
* @param str
* @return
*/
public static String rePlaceAllHtmlAndBlank(String str){
str = rePlaceAllHtml(str);//过滤html代码
Pattern p_html = Pattern.compile(regEx_blank, Pattern.CASE_INSENSITIVE);
Matcher m_html = p_html.matcher(str);
str = m_html.replaceAll(""); //过滤回车换行
return str.trim(); //过滤前后的空白字符
}
过滤html代码
最新推荐文章于 2022-04-11 19:11:20 发布