java去掉html标签以及截取概述

最新推荐文章于 2022-06-07 11:02:21 发布

吃范范

最新推荐文章于 2022-06-07 11:02:21 发布

阅读量278

点赞数

分类专栏：便捷工具类

本文链接：https://blog.csdn.net/fanhuiixa/article/details/109115912

版权

便捷工具类专栏收录该内容

29 篇文章 0 订阅

订阅专栏

一、去掉html
public static String delHTMLTag(String htmlStr) {
    String regEx_script = "<script[^>]*?>[\\s\\S]*?<\\/script>"; //定义script的正则表达式
    String regEx_style = "<style[^>]*?>[\\s\\S]*?<\\/style>"; //定义style的正则表达式
    String regEx_html = "<[^>]+>"; //定义HTML标签的正则表达式
    Pattern p_script = Pattern.compile(regEx_script, Pattern.CASE_INSENSITIVE);
    Matcher m_script = p_script.matcher(htmlStr);
    htmlStr = m_script.replaceAll(""); //过滤script标签
    Pattern p_style = Pattern.compile(regEx_style, Pattern.CASE_INSENSITIVE);
    Matcher m_style = p_style.matcher(htmlStr);
    htmlStr = m_style.replaceAll(""); //过滤style标签
    Pattern p_html = Pattern.compile(regEx_html, Pattern.CASE_INSENSITIVE);
    Matcher m_html = p_html.matcher(htmlStr);
    htmlStr = m_html.replaceAll(""); //过滤html标签
    return htmlStr.trim().replace("　", ""); //返回文本字符串
}

二、截取摘要

public R Edit(Article m) {
    //判断概述
    if (m.getSummary() == null || m.getSummary().length() == 0) {
        String str = uTableUtils.delHTMLTag(m.getContent());
        int strlen = 100;
        if (str.length() < 100)
            strlen = str.length();
        m.setSummary(str.substring(0, strlen));
    }
    saveOrUpdate(m);
    return R.ok("成功");
}

吃范范

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
java去掉html标签以及截取概述

一、去掉htmlpublic static String delHTMLTag(String htmlStr) { String regEx_script = "<script[^>]*?>[\\s\\S]*?<\\/script>"; //定义script的正则表达式 String regEx_style = "<style[^>]*?>[\\s\\S]*?<\\/style>"; //定义style的正则表达式 Str...
复制链接

扫一扫