文章标题

最新推荐文章于 2024-10-10 09:56:47 发布

QQ443419665

最新推荐文章于 2024-10-10 09:56:47 发布

阅读量495

点赞数

分类专栏：模版学习 html工具类文章标签： java 正则 html

本文链接：https://blog.csdn.net/QueenJade/article/details/47747443

版权

模版学习同时被 2 个专栏收录

2 篇文章 0 订阅

订阅专栏

html工具类

1 篇文章 0 订阅

订阅专栏

java 正则实现

去除内容中冗余
获取尖括号内的内容

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class HTMLSpirit {
    //保留<body></body>间的内容
    public static String delHTMLTag(String htmlStr) {
        String regEx_be4body = "<html[^>]+>[\\s\\S]*?<body[^>]*?>";
        String regEx_aftbody = "<\\/body>[\\s\\S]*?<\\/html>";
        //Pattern.CASE_INSENSITIVE 不区分大小写的UNICODE_CASE样式
        Pattern p_be4body = Pattern.compile(regEx_be4body,Pattern.CASE_INSENSITIVE);
        Matcher m_be4body = p_be4body.matcher(htmlStr);
        htmlStr = m_be4body.replaceAll("");

        Pattern p_aftbody = Pattern.compile(regEx_aftbody,Pattern.CASE_INSENSITIVE);
        Matcher m_aftbody = p_aftbody.matcher(htmlStr);
        htmlStr = m_aftbody.replaceAll("");

        return htmlStr.trim();
    }
    //...<..要取的内容..>...
    public static String getCleanAddress(String mailAddrs){
        StringBuffer addr=new StringBuffer();
        Pattern pattern = Pattern.compile("<(.*?)>");
        Matcher matcher = pattern.matcher(mailAddrs);
        if(matcher.find()){
            addr.append(matcher.group(1)+";");
            return addr.toString();
        }else {
            return mailAddrs;
        }
    }

}