先保存,估计能用到
![](https://i-blog.csdnimg.cn/blog_migrate/8f900a89c6347c561fdf2122f13be562.gif)
![ExpandedBlockStart.gif](https://i-blog.csdnimg.cn/blog_migrate/961ddebeb323a10fe0623af514929fc1.gif)
///
<summary>
/// 去除框架、去除连接、去除脚本等特殊字符。
/// </summary>
/// <param name="html"></param>
/// <returns></returns>
private string checkStr( string html)
{
System.Text.RegularExpressions.Regex regex1 = new System.Text.RegularExpressions.Regex( @" <script[\s\S]+</script *> " , System.Text.RegularExpressions.RegexOptions.IgnoreCase);
// System.Text.RegularExpressions.Regex regex2 = new System.Text.RegularExpressions.Regex(@" href *= *[\s\S]*script *:", System.Text.RegularExpressions.RegexOptions.IgnoreCase);
System.Text.RegularExpressions.Regex regex2 = new System.Text.RegularExpressions.Regex( @" (<a(.|\s)*?>)|</a> " , System.Text.RegularExpressions.RegexOptions.IgnoreCase);
System.Text.RegularExpressions.Regex regex3 = new System.Text.RegularExpressions.Regex( @" no[\s\S]*= " , System.Text.RegularExpressions.RegexOptions.IgnoreCase);
System.Text.RegularExpressions.Regex regex4 = new System.Text.RegularExpressions.Regex( @" <iframe[\s\S]+</iframe *> " , System.Text.RegularExpressions.RegexOptions.IgnoreCase);
System.Text.RegularExpressions.Regex regex5 = new System.Text.RegularExpressions.Regex( @" <frameset[\s\S]+</frameset *> " , System.Text.RegularExpressions.RegexOptions.IgnoreCase);
// System.Text.RegularExpressions.Regex regex6 = new System.Text.RegularExpressions.Regex(@"\<img[^\>]+\>", System.Text.RegularExpressions.RegexOptions.IgnoreCase);
System.Text.RegularExpressions.Regex regex7 = new System.Text.RegularExpressions.Regex( @" </p> " , System.Text.RegularExpressions.RegexOptions.IgnoreCase);
System.Text.RegularExpressions.Regex regex8 = new System.Text.RegularExpressions.Regex( @" <p> " , System.Text.RegularExpressions.RegexOptions.IgnoreCase);
// System.Text.RegularExpressions.Regex regex9 = new System.Text.RegularExpressions.Regex(@"<[^>]*>", System.Text.RegularExpressions.RegexOptions.IgnoreCase);
html = regex1.Replace(html, "" ); // 过滤<script></script>标记
html = regex2.Replace(html, "" ); // 过滤href=javas
cript: ( < A > ) 属性
html = regex3.Replace(html, " _disibledevent= " ); // 过滤其它控件的on...事件
html = regex4.Replace(html, "" ); // 过滤iframe
html = regex5.Replace(html, "" ); // 过滤frameset
// html = regex6.Replace(html, ""); // 过滤img
html = regex7.Replace(html, "" ); // 过滤frameset
html = regex8.Replace(html, "" ); // 过滤frameset
// html = regex9.Replace(html, ""); // 过滤html标签。
// html = html.Replace(" ", "");
html = html.Replace( " </strong> " , "" );
html = html.Replace( " <strong> " , "" );
return html;
/// 去除框架、去除连接、去除脚本等特殊字符。
/// </summary>
/// <param name="html"></param>
/// <returns></returns>
private string checkStr( string html)
{
System.Text.RegularExpressions.Regex regex1 = new System.Text.RegularExpressions.Regex( @" <script[\s\S]+</script *> " , System.Text.RegularExpressions.RegexOptions.IgnoreCase);
// System.Text.RegularExpressions.Regex regex2 = new System.Text.RegularExpressions.Regex(@" href *= *[\s\S]*script *:", System.Text.RegularExpressions.RegexOptions.IgnoreCase);
System.Text.RegularExpressions.Regex regex2 = new System.Text.RegularExpressions.Regex( @" (<a(.|\s)*?>)|</a> " , System.Text.RegularExpressions.RegexOptions.IgnoreCase);
System.Text.RegularExpressions.Regex regex3 = new System.Text.RegularExpressions.Regex( @" no[\s\S]*= " , System.Text.RegularExpressions.RegexOptions.IgnoreCase);
System.Text.RegularExpressions.Regex regex4 = new System.Text.RegularExpressions.Regex( @" <iframe[\s\S]+</iframe *> " , System.Text.RegularExpressions.RegexOptions.IgnoreCase);
System.Text.RegularExpressions.Regex regex5 = new System.Text.RegularExpressions.Regex( @" <frameset[\s\S]+</frameset *> " , System.Text.RegularExpressions.RegexOptions.IgnoreCase);
// System.Text.RegularExpressions.Regex regex6 = new System.Text.RegularExpressions.Regex(@"\<img[^\>]+\>", System.Text.RegularExpressions.RegexOptions.IgnoreCase);
System.Text.RegularExpressions.Regex regex7 = new System.Text.RegularExpressions.Regex( @" </p> " , System.Text.RegularExpressions.RegexOptions.IgnoreCase);
System.Text.RegularExpressions.Regex regex8 = new System.Text.RegularExpressions.Regex( @" <p> " , System.Text.RegularExpressions.RegexOptions.IgnoreCase);
// System.Text.RegularExpressions.Regex regex9 = new System.Text.RegularExpressions.Regex(@"<[^>]*>", System.Text.RegularExpressions.RegexOptions.IgnoreCase);
html = regex1.Replace(html, "" ); // 过滤<script></script>标记
html = regex2.Replace(html, "" ); // 过滤href=javas
cript: ( < A > ) 属性
html = regex3.Replace(html, " _disibledevent= " ); // 过滤其它控件的on...事件
html = regex4.Replace(html, "" ); // 过滤iframe
html = regex5.Replace(html, "" ); // 过滤frameset
// html = regex6.Replace(html, ""); // 过滤img
html = regex7.Replace(html, "" ); // 过滤frameset
html = regex8.Replace(html, "" ); // 过滤frameset
// html = regex9.Replace(html, ""); // 过滤html标签。
// html = html.Replace(" ", "");
html = html.Replace( " </strong> " , "" );
html = html.Replace( " <strong> " , "" );
return html;
第二个处理方法
![](https://i-blog.csdnimg.cn/blog_migrate/8f900a89c6347c561fdf2122f13be562.gif)
![ExpandedBlockStart.gif](https://i-blog.csdnimg.cn/blog_migrate/961ddebeb323a10fe0623af514929fc1.gif)
void
Page_Load(
object
o , EventArgs e)
{
if ( ! Page.IsPostBack)
{
string s = @" <span class=lframe-t-text>今日<font color=red>热门新闻</font></span><div>adfadf</div& amp; gt; " ;
s = System.Text.RegularExpressions.Regex.Replace(s, " <[^>]+> " , "" );
Response.Write(s);
}
}
{
if ( ! Page.IsPostBack)
{
string s = @" <span class=lframe-t-text>今日<font color=red>热门新闻</font></span><div>adfadf</div& amp; gt; " ;
s = System.Text.RegularExpressions.Regex.Replace(s, " <[^>]+> " , "" );
Response.Write(s);
}
}