java使用html标签_JAVA处理html标签

package com.nfa;

import java.util.regex.Matcher;

import java.util.regex.Pattern;

public class UtilHtml {

/*删除所有HTML标签,返回纯文本*/

public static String deleteAll(String html){

if(isBlank(html)){

return "";

}

Pattern p = Pattern.compile("]*)>");

Matcher m = p.matcher(html);

return m.replaceAll("");

}

/*删除指定单标签*/

public static String deleteTagsOfOne(String tag,String html){

String regxp = "]*)\\s*>";

Pattern p = Pattern.compile(regxp);

Matcher m = p.matcher(html);

StringBuffer sb = new StringBuffer();

boolean rs = m.find();

while (rs) {

m.appendReplacement(sb, "");

rs = m.find();

}

m.appendTail(sb);

return sb.toString();

}

/*删除指定成对标签*/

public static String deleteTagsOfTwo(String tag,String html){

if(isBlank(html)){

return html;

}

Pattern p = Pattern.compile("]*?>[\\s\\S]*?");

Matcher m = p.matcher(html);

return m.replaceAll("");

}

/*删除指定的属性*/

public static String deleteAttr(String attr,String html){

if(isBlank(html)){

return html;

}

Pattern p = Pattern.compile(attr+"=\"([^\"]+)\"");

Matcher m = p.matcher(html);

return m.replaceAll("");

}

/*删除所有空白字符*/

public static String deleteAllBlank(String html){

if(isBlank(html)){

return html;

}

Pattern p = Pattern.compile("[\\s| ]");

Matcher m = p.matcher(html);

return m.replaceAll("");

}

private static boolean isBlank(String str){

if(str!=null && str.trim().length()>0){

return false;

}else{

return true;

}

}

}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值