项目中有时候我们需要去掉内容的一些指定HTML标签,如去除div标签,去除A标签,去除Table标签等等,下面青岛星网跟大家分享一个封装的正则函数。
ASP去除HTML标签的正则函数
'/* 函数名称:qdxw_ReplaceHtml ClearHtml
'/* 函数语言:VBScript Language
'/* 作 用:清除文件HTML格式函数
'/* 传递参数:Content (注:需要进行清除的内容)
'/* 函数说明:正则匹配(正则表达式)模式进行数据匹配替换
Function ClearHtml(Content)
Content=qdxw_ReplaceHtml("[^>]*;", "", Content)
Content=qdxw_ReplaceHtml("?marquee[^>]*>", "", Content)
Content=qdxw_ReplaceHtml("?object[^>]*>", "", Content)
Content=qdxw_ReplaceHtml("?param[^>]*>", "", Content)
Content=qdxw_ReplaceHtml("?embed[^>]*>", "", Content)
Content=qdxw_ReplaceHtml("?table[^>]*>", "", Content)
Content=qdxw_ReplaceHtml(" ","",Content)
Content=qdxw_ReplaceHtml("?tr[^>]*>", "", Content)
Content=qdxw_ReplaceHtml("?th[^>]*>","",Content)
Content=qdxw_ReplaceHtml("?p[^>]*>","",Content)
Content=qdxw_ReplaceHtml("?a[^>]*>","",Content)
Content=qdxw_ReplaceHtml("?img[^>]*>","",Content)
Content=qdxw_ReplaceHtml("?tbody[^>]*>","",Content)
Content=qdxw_ReplaceHtml("?li[^>]*>","",Content)
Content=qdxw_ReplaceHtml("?span[^>]*>","",Content)
Content=qdxw_ReplaceHtml("?div[^>]*>","",Content)
Content=qdxw_ReplaceHtml("?th[^>]*>", "", Content)
Content=qdxw_ReplaceHtml("?td[^>]*>", "", Content)
Content=qdxw_ReplaceHtml("?script[^>]*>", "", Content)
Content=qdxw_ReplaceHtml("(javascript|jscript|vbscript|vbs):", "", Content)
Content=qdxw_ReplaceHtml("on(mouse|exit|error|click|key)", "", Content)
Content=qdxw_ReplaceHtml("/?xml[^>]*>", "", Content)
Content=qdxw_ReplaceHtml("/?[a-z]+:[^>]*>", "", Content)
Content=qdxw_ReplaceHtml("?font[^>]*>", "", Content)
Content=qdxw_ReplaceHtml("?b[^>]*>","",Content)
Content=qdxw_ReplaceHtml("?u[^>]*>","",Content)
Content=qdxw_ReplaceHtml("?i[^>]*>","",Content)
Content=qdxw_ReplaceHtml("?strong[^>]*>","",Content)
ClearHtml=Content
End Function
Function qdxw_ReplaceHtml(patrn, strng,content)
IF IsNull(content) Then
content=""
End IF
Set regEx = New RegExp ' 建立正则表达式。
regEx.Pattern = patrn ' 设置模式。
regEx.IgnoreCase = true ' 设置忽略字符大小写。
regEx.Global = True ' 设置全局可用性。
qdxw_ReplaceHtml=regEx.Replace(content,strng) ' 执行正则匹配
End Function
%>
调用函数:ClearHtml() 即可
使用方法为:ClearHtml(Content),其中Content为欲清除的代码存放的变量