利用正则表达式过滤掉HTML字符及自己指定的字符

最新推荐文章于 2022-09-23 11:21:40 发布

aspnet2002web

最新推荐文章于 2022-09-23 11:21:40 发布

阅读量1k

点赞数 1

分类专栏： .NET字符串与正则文章标签：正则表达式 html string class 脚本

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/aspnet2002web/article/details/6115828

版权

.NET字符串与正则专栏收录该内容

2 篇文章 0 订阅

订阅专栏

using System;

using System.Collections.Generic;

using System.Linq;

using System.Text;

using System.Text.RegularExpressions;

using System.Web;

namespace Utility

{

public class StringUtil

{

/// <summary>

/// 过滤掉HTML标签

/// </summary>

/// <param name="Htmlstring"></param>

/// <returns></returns>

public static string NoHTML(string Htmlstring)

{

//正则表达式&.*?; 可以去掉所有的“&开头;结尾的”

//正则表达式 <.*?> 可以去掉所有 <> </>之类的

//正则表达式 >(.*)</li> 获取<li>和</li>之间的内容

//正则表达式 <[^>]*> 获取网页文本内容

//删除脚本

Htmlstring = Regex.Replace(Htmlstring, @"<script[^>]*?>.*?</script>", "",RegexOptions.IgnoreCase);

//删除HTML

Htmlstring = Regex.Replace(Htmlstring, @"<(.[^>]*)>", "",RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"([/r/n])[/s]+", "",RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"-->", "", RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"<!--.*", "", RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"&(quot|#34);", "/"",RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"&(amp|#38);", "&",RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"&(lt|#60);", "<",RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"&(gt|#62);", ">",RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"&(nbsp|#160);", " ",RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"&(iexcl|#161);", "/xa1",RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"&(cent|#162);", "/xa2",RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"&(pound|#163);", "/xa3",RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"&(copy|#169);", "/xa9",RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"&#(/d+);", "",RegexOptions.IgnoreCase);

Htmlstring.Replace("<", "");

Htmlstring.Replace(">", "");

Htmlstring.Replace("/r/n", "");

Htmlstring.Replace("|", "");

Htmlstring = HttpContext.Current.Server.HtmlEncode(Htmlstring).Trim();

return Htmlstring;

}

}

}

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
利用正则表达式过滤掉HTML字符及自己指定的字符

<br />using System;<br />using System.Collections.Generic;<br />using System.Linq;<br />using System.Text;<br />using System.Text.RegularExpressions;<br />using System.Web;<br /> <br />namespace Utility<br />{<br /> publicclassStringUtil<br /> {<br /
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。