剔除HTML文档的HTML标记,转换为纯文本

None.gif 将文章用文本格式保存,而不是直接使用HTML存储,这样的话会节约数据库空间.
None.gif于是写了这么个函数来将文本中的HTML标记剔除 
None.gif 
None.gif函数虽然简单,但是对处理HTML文档还是很有效的 
None.gif
<
None.gif
Function  RemoveHTML(strHTML) 
None.gif 
Dim  objRegExp, Match, Matches    
None.gif 
Set  objRegExp  =   New  Regexp 
None.gif  
None.gif objRegExp.IgnoreCase 
=   True  
None.gif objRegExp.Global 
=   True  
None.gif 
' 取闭合的<> 
None.gif
 objRegExp.Pattern  =   " <.+?> "  
None.gif 
' 进行匹配 
None.gif
  Set  Matches  =  objRegExp. Execute (strHTML) 
None.gif  
None.gif 
'  遍历匹配集合,并替换掉匹配的项目 
None.gif
  For   Each  Match in Matches    
None.gif     strHtml
= Replace (strHTML,Match.Value, ""
None.gif 
Next  
None.gif RemoveHTML
= strHTML 
None.gif 
Set  objRegExp  =   Nothing  
None.gif
End Function  
None.gif 
None.gif%
>  
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值