去除字符串中的HTML标签

原创 2012年03月23日 18:08:57
       public static string NoHTML(string strHtml)
        {
            string[] aryReg ={
                            @"<script[^>]*?>.*?</script>",
                            @"<(\/\s*)?!?((\w+:)?\w+)(\w+(\s*=?\s*(([""'])(\\[""'tbnr]|[^\7])*?\7|\w+)|.{0})|\s)*?(\/\s*)?>",
                            @"([\r\n])[\s]+",
                            @"&(quot|#34);",
                            @"&(amp|#38);",
                            @"&(lt|#60);",
                            @"&(gt|#62);",
                            @"&(nbsp|#160);",
                            @"&(iexcl|#161);",
                            @"&(cent|#162);",
                            @"&(pound|#163);",
                            @"&(copy|#169);",
                            @"&#(\d+);",
                            @"-->",
                            @"<!--.*\n"
                        };
            string[] aryRep =   {
                                "",
                                "",
                                "",
                                "\"",
                                "&",
                                "<",
                                ">",
                                "   ",
                                "\xa1",//chr(161),   
                                "\xa2",//chr(162),   
                                "\xa3",//chr(163),   
                                "\xa9",//chr(169),   
                                "",
                                "\r\n",
                                ""
                            };
            string newReg = aryReg[0];
            string strOutput = strHtml;
            for (int i = 0; i < aryReg.Length; i++)
            {
                Regex regex = new Regex(aryReg[i], RegexOptions.IgnoreCase);
                strOutput = regex.Replace(strOutput, aryRep[i]);
            }
            strOutput.Replace("<", "");
            strOutput.Replace(">", "");
            strOutput.Replace("\r\n", "");
            return strOutput;
        }
版权声明:本文为博主原创文章,未经博主允许不得转载。

ASP.NET去除HTML标签并截取指定长度字符串

当我们使用编辑器存储内容时,保存到数据库的内容可含有html标签,如果要将其查询出来展示在页面上时有时会用到字符串截取,这时我们应该先对其进行html解码,再去html标签,最后再截取指定长度字符串。...

java使用正则表达式去除字符串的html标签

摘自网上:http://www.javaeye.com/topic/217508 新闻内容或者博客文章,如果显示摘要,需要去除内容的html格式标签,找到一个正则表达式,实现了: /** * 删...

SQL去除字符串中HTML标签

当一个字段中存储有带有html标签的字符串,而我们想获取的是该字符的纯文本时应该怎么处理,其中一个实现方法就是创建一个去html的函数,当需要时直接调用即可。自定义函数如下:create functi...

用C#去除字符串中HTML的格式(清除数据库中html标签)

出自:http://blog.csdn.net/savagelin/article/details/6604884 http://www.cnblogs.com/sophist/archive/20...

过滤含html标签的字符串

  • 2010年05月28日 21:00
  • 3KB
  • 下载

过滤字符串中的HTML标签

  • 2009年11月04日 12:41
  • 211B
  • 下载

Android 控件对带有Html标签的字符串用法

安卓控件对带有Html标签的字符串使用方法: 1.直接在string的XML文件中定义,并在layout中直接引用。 String中: Hello World! <b>Hello World!...
  • artzok
  • artzok
  • 2015年12月08日 17:34
  • 1108

获取HTML字符串中的特定标签

var txt= "Inhib] ${name}$${product1}$${produ4ct28}$[空$换行]${Revies}$[空行]Cou${product9}$p}o"; ...
  • Matol
  • Matol
  • 2012年03月30日 13:42
  • 573

Objective-C里字符串NSString过滤HTML标签的方法

//第一种,用NSScanner扫描,来自下面这个著名的链接,不过现在打不开鸟~  // Source: http://rudis.net/content/2009/01/21/flatten-h...
  • nyh1006
  • nyh1006
  • 2014年07月23日 17:40
  • 3219

textView显示html带img标签的字符串(支持minSdkVersion>8)

public class Html_TextView_TestActivity extends Activity { /** Called when the activity is first cr...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:去除字符串中的HTML标签
举报原因:
原因补充:

(最多只允许输入30个字)