javascript 代码过滤:
<(s|S)(c|C)(r|R)(i|I)(p|P)(t|T)(/s+[^>]*>|>)(/s|/n.*)*[^<]*</(s|S)(c|C)(r|R)(i|I)(p|P)(t|T)/s*>
email格式:
([a-z|A-Z|/d][/./w-]*@([/w-]+/.)+/w{2,3})
URL网址格式:
((https?|ftp|svn):)?(w{3}|/w{2,})/./w+-?/w+/./w{2,3}.*
HTML无效代码过滤:
(/s*</?(td|img|div|tr|a|table|b)(>|[^r][^>]*>)/s*)+
该字符串已设定过滤td img div tr a table b等HTML开头和结尾的代码(保留了<br>),主要用于提取WEB源代码中的有效内容,并保留原WEB页面的<br>断行规则,使用时可根据需要增删
先列一些基本的,其它的根据大家的需要和以后的使用频率再提供……
这些都是本人日常应用中的匹配规则,有不正确的或者是考虑不全面的,还望各位大侠高人斧正!
<(s|S)(c|C)(r|R)(i|I)(p|P)(t|T)(/s+[^>]*>|>)(/s|/n.*)*[^<]*</(s|S)(c|C)(r|R)(i|I)(p|P)(t|T)/s*>
email格式:
([a-z|A-Z|/d][/./w-]*@([/w-]+/.)+/w{2,3})
URL网址格式:
((https?|ftp|svn):)?(w{3}|/w{2,})/./w+-?/w+/./w{2,3}.*
HTML无效代码过滤:
(/s*</?(td|img|div|tr|a|table|b)(>|[^r][^>]*>)/s*)+
该字符串已设定过滤td img div tr a table b等HTML开头和结尾的代码(保留了<br>),主要用于提取WEB源代码中的有效内容,并保留原WEB页面的<br>断行规则,使用时可根据需要增删
先列一些基本的,其它的根据大家的需要和以后的使用频率再提供……
这些都是本人日常应用中的匹配规则,有不正确的或者是考虑不全面的,还望各位大侠高人斧正!