Java剔除富文本的HTML标签并保留换行

 /**
     * 剔除html标签,并保留换行
     * @param html
     * @return
     */
    public static String removeHtmlTags(String html) {
        Pattern pattern = Pattern.compile(HtmlUtil.RE_HTML_MARK);
        Matcher matcher = pattern.matcher(html);
        StringBuffer result = new StringBuffer();
        // 使用循环逐个匹配替换标签
        while (matcher.find()) {
            String matchedTag = matcher.group();
            if (matchedTag.startsWith("</p>") || matchedTag.startsWith("<br>") || matchedTag.startsWith("</li>")) {
                matcher.appendReplacement(result, System.lineSeparator());
            } else {
                matcher.appendReplacement(result, "");
            }
        }
        matcher.appendTail(result);
        // 去掉首尾空白,并剔除连续换行符
        return removeMultipleNewlines(result.toString().trim());
    }

    /**
     * 剔除连续换行符
     * @param content
     * @return
     */
    public static String removeMultipleNewlines(String content) {
        // 使用正则表达式剔除连续多个换行符
        Pattern newLines = Pattern.compile("(\\r?\\n){2,}");
        Matcher matcher = newLines.matcher(content);
        return matcher.replaceAll(System.lineSeparator());
    }
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值