工具类之剔除Html标签 Java

如题:

 /**
     * 去除html格式,提取文字信息
     */
    public static String getContent(String content){
        if(StringUtil.isNull(content)){
            return "";
        }
        String txtcontent = setTextAreaHtml(content).replaceAll("</?[^>]+>", ""); //剔出<html>的标签
        txtcontent = txtcontent.replaceAll("<a>\\s*|\t|\r|\n</a>", "");//去除字符串中的空格,回车,换行符,制表符
        return txtcontent;
    }

    public static String setTextAreaHtml(String content){
        return content.replaceAll("&lt;", "<").replaceAll("gt;", ">").replaceAll("&amp;", "&").replaceAll("&quot;", "\"").replaceAll("&apos;", "'").replaceAll("&nbsp;"," ");
    }
发布了50 篇原创文章 · 获赞 46 · 访问量 21万+
展开阅读全文

没有更多推荐了,返回首页

©️2019 CSDN 皮肤主题: 大白 设计师: CSDN官方博客

分享到微信朋友圈

×

扫一扫,手机浏览