去除HTML标记

原创 2009年02月28日 13:23:00

 /// 去除HTML标记
        public static string NoHTML(string strHtml)
        {
            strHtml= Regex.Replace(strHtml, @"<script[^>]*?>.*?</script>", "", RegexOptions.IgnoreCase);           

 strHtml= Regex.Replace(strHtml, @"<(.[^>]*)>", "", RegexOptions.IgnoreCase);
            strHtml= Regex.Replace(strHtml, @"([/r/n])[/s]+", "", RegexOptions.IgnoreCase);
            strHtml= Regex.Replace(strHtml, @"-->", "", RegexOptions.IgnoreCase);
            strHtml= Regex.Replace(strHtml, @"<!--.*", "", RegexOptions.IgnoreCase);

            strHtml= Regex.Replace(strHtml, @"&(quot|#34);", "/"", RegexOptions.IgnoreCase);
            strHtml= Regex.Replace(strHtml, @"&(amp|#38);", "&", RegexOptions.IgnoreCase);
            strHtml= Regex.Replace(strHtml, @"&(lt|#60);", "<", RegexOptions.IgnoreCase);
            strHtml= Regex.Replace(strHtml, @"&(gt|#62);", ">", RegexOptions.IgnoreCase);
            strHtml= Regex.Replace(strHtml, @"&(nbsp|#160);", " ", RegexOptions.IgnoreCase);
            strHtml= Regex.Replace(strHtml, @"&(iexcl|#161);", "/xa1", RegexOptions.IgnoreCase);
            strHtml= Regex.Replace(strHtml, @"&(cent|#162);", "/xa2", RegexOptions.IgnoreCase);
            strHtml= Regex.Replace(strHtml, @"&(pound|#163);", "/xa3", RegexOptions.IgnoreCase);
            strHtml= Regex.Replace(strHtml, @"&(copy|#169);", "/xa9", RegexOptions.IgnoreCase);
            strHtml= Regex.Replace(strHtml, @"&#(/d+);", "", RegexOptions.IgnoreCase);

            strHtml.Replace("<", "");
            strHtml.Replace(">", "");
            strHtml.Replace("/r/n", "");
            strHtml= HttpContext.Current.Server.HtmlEncode(strHtml).Trim();

            return strHtml;
        }

版权声明:本文为博主原创文章,未经博主允许不得转载。

相关文章推荐

去除HTML标记的代码

  • 2009-10-14 12:45
  • 503B
  • 下载

C# .Net使用正则表达式去除HTML标记和空格

using System.Text.RegularExpressions; 在进行数据采集,显示文章摘要,内容计数等情况下,需要清除源代码中的html标签,空格,style,script等标签. ...
  • atco
  • atco
  • 2012-02-24 11:25
  • 5615

ASP.NET去除HTML标记,取出文本中的图片地址,移除HTML标签

#region 去除HTML标记 /// /// 去除HTML标记 /// /// 包括HTML的源码 /// 已...

【叶子函数分享一】去除字符串中的html标记及标记中的内容

【叶子函数分享一】去除字符串中的html标记及标记中的内容--1、创建函数create function [dbo].[clearhtml] (@maco varchar(8000))returns ...

【叶子函数分享一】去除字符串中的html标记及标记中的内容

【叶子函数分享一】去除字符串中的html标记及标记中的内容

HTML标记大全

  • 2015-04-04 19:34
  • 152KB
  • 下载

第2章超文本标记语言(HTML)

  • 2015-06-13 15:36
  • 1.22MB
  • 下载

HTML图像标记

今天看到的丰富多彩的网页,都是因为有了图像的作用。想一想过去,网络中全部都是纯文本的网页,非常枯燥,就知道图像在网页设计中的重要性了。在html页面中可以插入图像,网页常用的图像格式有JPEG和GIF...

html4.0标记

  • 2015-08-03 07:22
  • 158KB
  • 下载

html标记总结

  • 2014-03-18 13:28
  • 45KB
  • 下载
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:深度学习:神经网络中的前向传播和反向传播算法推导
举报原因:
原因补充:

(最多只允许输入30个字)