正则表达式彻底去除HTML

 public static String RMHTML(String Htmlstring)

 {

/**

转载请注明:

PowerBy:Lulu

Www.HotCity.Cn

*/

// 删除脚本

 Htmlstring = RegexPattern("<//s*?script[^>]*>[//s//S]*?<//s*?///s*?script//s*?>","",Htmlstring);

// 删除HTML

 Htmlstring = RegexPattern("<([^>]*)>", "",Htmlstring);

 Htmlstring = RegexPattern( "([/r/n])[//s]+", "",Htmlstring);

 Htmlstring = RegexPattern( "-->", "",Htmlstring);

 Htmlstring = RegexPattern( "<!--.*", "",Htmlstring);

 Htmlstring = RegexPattern( "&(quot|#34);", "/"",Htmlstring);

 Htmlstring = RegexPattern( "&(amp|#38);", "&",Htmlstring);

 Htmlstring = RegexPattern( "&(lt|#60);", "<",Htmlstring);

 Htmlstring = RegexPattern( "&(gt|#62);", ">",Htmlstring);

 Htmlstring = RegexPattern( "&(nbsp|#160);", " ",Htmlstring);

 Htmlstring = RegexPattern( "&(iexcl|#161);", "//xa1",Htmlstring);

 Htmlstring = RegexPattern( "&(cent|#162);", "//xa2",Htmlstring);

 Htmlstring = RegexPattern( "&(pound|#163);", "//xa3",Htmlstring);

 Htmlstring = RegexPattern( "&(copy|#169);", "//xa9",Htmlstring);

 Htmlstring = RegexPattern( "&#(//d+);", "",Htmlstring);

 

 Htmlstring = RegexPattern("<", "",Htmlstring);

 Htmlstring = RegexPattern(">", "",Htmlstring);

 //Htmlstring.replace("/r/n", "",Htmlstring);

 

 return Htmlstring;

 }
   public static String RegexPattern(String pattern,String str,String content){

       if(pattern!=null && !pattern.equals("")){


           Pattern p = Pattern.compile(pattern,2); //参数2表示大小写不区分

           Matcher m = p.matcher(content);
           content=m.replaceAll(str);
 

       }
       return content;      
   } 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值