/**
* 替换掉<img></img>和<img />的形式的字符串为空字符串〈简述〉 〈详细描述〉
*
* @author gongsf
* @param html html源文件
* @return
*/
public static String dealImage(String html) {
// html = "<div id='test'><img src='aaa' height='4' width='4'></img><img
// src='ff' width='44' height='444' /></div>";
// 要被过滤的字符串
String str = html.replaceAll("<img.*>.*</img>", "[图片]").replaceAll(
"<img.*/>", "[图片]");
return str;
}
/**
* html去除格式,只剩纯文字〈简述〉 〈详细描述〉
*
* @author gongsf
* @param html html源文件
* @return
*/
public static String dealHtml(String html) {
return html.replaceAll("</?[^>]+>", "");
}