[VB.NET]求一个正则表达式处理一下html

最新推荐文章于 2021-06-02 17:28:41 发布

mohongmao

最新推荐文章于 2021-06-02 17:28:41 发布

阅读量806

点赞数

分类专栏： [VB.NET论坛] 文章标签：正则表达式 vb.net html each up

[VB.NET论坛] 专栏收录该内容

757 篇文章 13 订阅

订阅专栏

VB.NET源码-156个实用实例哦……

<script type="text/javascript"> </script> <script type="text/javascript" src="http://pagead2.googlesyndication.com/pagead/show_ads.js"> </script>
求一个正则表达式处理一下html
想去除html中除链接标记之外的所有标记，即字符串中遇到象 <...> 这样的部分，如果其中包含href或/a则保留，其余删除。
我原来是这么写的：
For Each m As Match In Regex.Matches(ss, <[^> ]*> , egexOptions.IgnoreCase)
If InStr(LCase(m.Value), href ) < 1 AndAlso LCase(m.Value) <> then
ss = Replace(ss, m.Value, )
End If
Next
不过我觉得这么作可能效率比较低，希望能通过一条正则表达式搞定。
__________________________________________________________________________
up
__________________________________________________________________________
顶顶...
__________________________________________________________________________
何必呢，那不会取出所有的标签，而不是去除所有不是的标签．
__________________________________________________________________________
我就是要去除所有不是的标签
__________________________________________________________________________
我的意思是，用正则表达式，取出所有是的内容．
__________________________________________________________________________
try

<(?!(a/s|/a> ))[^> ]*?>
__________________________________________________________________________

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。