言于头:本章是说明如何从一段html标签中获取文本内容,比如 <a>啦啦啦</a> 通过该方法处理直接提取出 啦啦啦,具体方法总结如下。
public String replaceHtmlStr(String input){
if (input == null || input.trim().equals("")) {
return "";
}
// 去掉所有html元素
String str = input.replaceAll("\\&[a-zA-Z]{1,10};", "")
.replaceAll("<[^>]*>", "").replaceAll("[(/>)<]", "")
.replaceAll("\r\n", "").replaceAll(" ", "").trim();
return str;
}