总结:
1.使用 HtmlUtils.htmlEscape ()方法对 字符串中的标签转义
2.使用 removeHtmlTag() 得数据
具体步骤如下:
我的数据库的存储格式被转义过了,这个因人而异
org.springframework.web.util.HtmlUtils 可以实现HTML标签及转义字符之间的转换。
- 使用 HtmlUtils.htmlEscape 对数据库存的标签转义 也就是将 ” & lt; “转化为 < 等等。。
比如说如图数据库的数据是
<span style="font-family:微软雅黑;font-size:24px;">继徐翔之后,又出一股市奇才,自创"狙击涨停三板斧",被散户称之为“草根股神”的</span><span style="font-family:微软雅黑;font-size:24px;">秦泽晨引大量媒体报道!</span>
使用HtmlUtils.htmlUnescape(); 方法
HtmlUtils.htmlUnescape(bookSystemNew.getNewsContent())
//所得结果 <span style="font-family:微软雅黑;font-size:24px;">继徐翔之后,又出一股市奇才,自创"狙击涨停三板斧",被散户称之为“草根股神”的</span><span style="font-family:微软雅黑;font-size:24px;">秦泽晨引大量媒体报道!</span>
- 取出标签中的数据 使用removeHtmlTag方法
所得结果
继徐翔之后,又出一股市奇才,自创"狙击涨停三板斧",被散户称之为“草根股神”的秦泽晨引大量媒体报道!
removeHtmlTag(HtmlUtils.htmlUnescape(bookSystemNew.getNewsContent()))
/**
* 去除富文本编辑器标签
*
* @param inputString
* @return
*/
public static String removeHtmlTag(String inputString) {
if (inputString == null)
return null;
String htmlStr = inputString; // 含html标签的字符串
String textStr = "";
java.util.regex.Pattern p_script;
java.util.regex.Matcher m_script;
java.util.regex.Pattern p_style;
java.util.regex.Matcher m_style;
java.util.regex.Pattern p_html;
java.util.regex.Matcher m_html;
try {
//定义script的正则表达式{或<script[^>]*?>[\\s\\S]*?<\\/script>
String regEx_script = "<[\\s]*?script[^>]*?>[\\s\\S]*?<[\\s]*?\\/[\\s]*?script[\\s]*?>";
//定义style的正则表达式{或<style[^>]*?>[\\s\\S]*?<\\/style>
String regEx_style = "<[\\s]*?style[^>]*?>[\\s\\S]*?<[\\s]*?\\/[\\s]*?style[\\s]*?>";
String regEx_html = "<[^>]+>"; // 定义HTML标签的正则表达式
p_script = Pattern.compile(regEx_script, Pattern.CASE_INSENSITIVE);
m_script = p_script.matcher(htmlStr);
htmlStr = m_script.replaceAll(""); // 过滤script标签
p_style = Pattern.compile(regEx_style, Pattern.CASE_INSENSITIVE);
m_style = p_style.matcher(htmlStr);
htmlStr = m_style.replaceAll(""); // 过滤style标签
p_html = Pattern.compile(regEx_html, Pattern.CASE_INSENSITIVE);
m_html = p_html.matcher(htmlStr);
htmlStr = m_html.replaceAll(""); // 过滤html标签
textStr = htmlStr;
} catch (Exception e) {
e.printStackTrace();
}
return textStr;// 返回文本字符串
}