html标签的正则表达式

处理一个HTML网页的时候,需要把所有的HTML标签去除,想到了正则:

[color=green]正确的[/color]

String[] args = content.split("<([^>]*)>");// 匹配HTML便签

在"^>" 中 "^"是"非"的意思,并不是 "开始"标记,"^"只有放到开头的地方时才表示"开始"

[color=red]错误的[/color]

String[] args = content.split("<([\\d\\D]*)>");// 匹配HTML便签

刚开始在网上找的,结果试了半天不对,纠结了好久才明白。
\d\D 把">"也包括了,结果根本找不到右边界,匹配不到结果。

网上说"<([^>]*)>" 并不能匹配完全,有待验证。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值