C#正则表达式

转载 2013年12月04日 10:17:15
            regex_str = "( )+";//替换 为空格
            tmpContent = Regex.Replace(tmpContent, regex_str, " ", RegexOptions.IgnoreCase);
            regex_str = "<script type=\\s*[^>]*>[^<]*?</script>";//替换<script>内容</script>为空格
            tmpContent = Regex.Replace(tmpContent, regex_str, "", RegexOptions.IgnoreCase);            regex_str = "<[^<]*>";//替换Html标签为空
            tmpContent = Regex.Replace(tmpContent, regex_str, "", RegexOptions.IgnoreCase);            regex_str = "(\r\n)*";//替换\r\n为空
            tmpContent = Regex.Replace(tmpContent, regex_str, "", RegexOptions.IgnoreCase);            regex_str = "\n*";//替换\n为空
            tmpContent = Regex.Replace(tmpContent, regex_str, "", RegexOptions.IgnoreCase);            regex_str = "\t*";//替换\t为空
            tmpContent = Regex.Replace(tmpContent, regex_str, "", RegexOptions.IgnoreCase);            regex_str = "'";//替换'为’
            tmpContent = Regex.Replace(tmpContent, regex_str, "’", RegexOptions.IgnoreCase);            regex_str = " +";//替换若干个空格为一个空格
            tmpContent = Regex.Replace(tmpContent, regex_str, "  ", RegexOptions.IgnoreCase);

  1. Regex regex = new Regex(@"##");bodyStr = regex.Replace(bodyStr, temp =>
    {
    string key = temp.Value;
    if (dic.ContainsKey(key))
    return dic[key];
    else
    return temp.Value;
    }, 99999);dic为字典,bodystr为网页源码
      

  2. //regex_str = "(&nbsp;)+";//替换&nbsp;为空格
    regex_str = "(?i)&nbsp;";//替换&nbsp;为空格
    tmpContent = Regex.Replace(tmpContent, regex_str, " ");//regex_str="<script type=\\s*[^>]*>[^<]*?</script>";//替换<script>内容</script>为空格
    regex_str = "(?is)<script[^>]*>.*?</script>";//替换<script>内容</script>为空格
    tmpContent = Regex.Replace(tmpContent, regex_str, "");//regex_str = "<[^<]*>";//替换Html标签为空
    regex_str = "<[^<>]*>";//替换Html标签为空
    tmpContent = Regex.Replace(tmpContent, regex_str, "");//regex_str = "(\r\n)*";//替换\r\n为空
    regex_str = @"[\r\n]*";//替换\r\n为空
    tmpContent = Regex.Replace(tmpContent, regex_str, "", RegexOptions.IgnoreCase);//regex_str = "\n*";//替换\n为空
    regex_str = @"\n*";//替换\n为空
    tmpContent = Regex.Replace(tmpContent, regex_str, "", RegexOptions.IgnoreCase);//可以这样
    regex_str = "\t*";//替换\t为空
    tmpContent = Regex.Replace(tmpContent, regex_str, "", RegexOptions.IgnoreCase);//可以
    regex_str = "'";//替换'为’
    tmpContent = Regex.Replace(tmpContent, regex_str, "’", RegexOptions.IgnoreCase);//可以
    regex_str = " +";//替换若干个空格为一个空格
    tmpContent = Regex.Replace(tmpContent, regex_str, "  ", RegexOptions.IgnoreCase);其实你这些可以整合写成一个正则的。
      

  3. //regex_str = "(&nbsp;)+";//替换&nbsp;为空格
    regex_str = "(?i)&nbsp;";//替换&nbsp;为空格
    tmpContent = Regex.Replace(tmpContent, regex_str, " ");//regex_str="<script type=\\s*[^>]*>[^<]*?</script>";//替换<script>内容</script>为空格
    regex_str = "(?is)<script[^>]*>.*?</script>";//替换<script>内容</script>为空格
    tmpContent = Regex.Replace(tmpContent, regex_str, "");//regex_str = "<[^<]*>";//替换Html标签为空
    regex_str = "<[^<>]*>";//替换Html标签为空
    tmpContent = Regex.Replace(tmpContent, regex_str, "");//regex_str = "(\r\n)*";//替换\r\n为空
    regex_str = @"[\r\n]*";//替换\r\n为空
    tmpContent = Regex.Replace(tmpContent, regex_str, "", RegexOptions.IgnoreCase);//regex_str = "\n*";//替换\n为空
    regex_str = @"\n*";//替换\n为空
    tmpContent = Regex.Replace(tmpContent, regex_str, "", RegexOptions.IgnoreCase);//可以这样
    regex_str = "\t*";//替换\t为空
    tmpContent = Regex.Replace(tmpContent, regex_str, "", RegexOptions.IgnoreCase);//可以
    regex_str = "'";//替换'为’
    tmpContent = Regex.Replace(tmpContent, regex_str, "’", RegexOptions.IgnoreCase);//可以
    regex_str = " +";//替换若干个空格为一个空格
    tmpContent = Regex.Replace(tmpContent, regex_str, "  ", RegexOptions.IgnoreCase);其实你这些可以整合写成一个正则的。
      
  4. string s = "";
    Regex reg = new Regex(@"(?is)(?:(&nbsp;|<script[^>]*>.*?</script>| +)|(<[^<>]*>|[\r\n\t]*)|('))");
    string result = reg.Replace(s, delegate(Match m)
    {
        if (m.Groups[1].Success) return " ";
        else if (m.Groups[2].Success) return "";
        else if (m.Groups[3].Success) return "’";
        else return "";
    });

相关文章推荐

C#之正则表达式使用

  • 2016-01-27 20:55
  • 37KB
  • 下载

C#中的正则表达式

其中如果包含的字符串中包含双引号,那么就两个双引号表示,而不是反斜杠加上双引号(\”),也不是斜杠加上双引号(/”)     正则表达式获取CSS里面的图片的例子,里面有URL里面的图片地址有双引号...

C#字符串和正则表达式

  • 2013-08-09 13:59
  • 9.86MB
  • 下载

C# 正则表达式

  • 2013-09-17 21:45
  • 9.86MB
  • 下载

C#中如何使用正则表达式

C#中如何使用正则表达式多少年来,许多的编程语言和工具都包含对正则表达式的支持,.NET基础类库中包含有一个名字空间和一系列可以充分发挥规则表达式威力的类,而且它们也都与未来的Perl 5中的规则表达...

C#正则表达式用法

  • 2013-06-08 19:20
  • 129KB
  • 下载

全面剖析C#正则表达式

在此之前关于正则表达式的基础可参见如下:正则表达式快速入门:http://blog.csdn.net/andrew_wx/article/details/6597957 正则表达式基础知识:http:...

C#正则表达式

  • 2015-12-14 09:41
  • 60KB
  • 下载
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:深度学习:神经网络中的前向传播和反向传播算法推导
举报原因:
原因补充:

(最多只允许输入30个字)