java去掉style_Java-正则表达式去掉html字符串内部的所有样式style="***"(转载记录)...

从使用正则表达式学习正则表达式。

从网页获取的自己关心的内容后,有些标签会有内联样式,例如

如何只要span而不要style

其他的div什么的都一样。

这个样式是包含(前面有个空格) style=”中间任意多个字符串后面一个”。

来看正则表达式的写法

String regEx = " style=\"(.*?)\"";

使用到的正则规则

字符说明

(pattern)匹配 pattern 并捕获该匹配的子表达式。若要匹配括号字符 ( ),请转义。

.匹配除”\r\n”之外的任何单个字符。若要匹配包括”\r\n”在内的任意字符,请使用诸如”[\s\S]”之类的模式。

*零次或多次匹配前面的字符或子表达式。例如,zo* 匹配”z”和”zoo”。* 等效于 {0,}。

?零次或一次匹配前面的字符或子表达式。例如,”do(es)?”匹配”do”或”does”中的”do”。? 等效于 {0,1}。

结果

关键代码

String content = "带有html标签的内容";

// 正则表达式

String regEx = " style=\"(.*?)\"";

Pattern p = Pattern.compile(regEx);

Matcher m = p.matcher(content);

String okContent = null;

if (m.find()) {

okContent = m.replaceAll("");

}

System.out.println(okContent);

————————————————

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值