Regular Expression 正则表达式-1 (C#)

原创 2004年10月04日 20:48:00

起因是因为一片帖子,问到了一个问题,帖子是这样的:

Originally Posted by 人就是这样
我想编一个程序,但学CompSci是很久以前的事情了。想请教请教大家。

有两个txt文件,一个叫source.txt(有很多数据), 一个叫target.txt(空白的)

我想把source.txt里的一些数据提取出来(稍微修改一下),然后写到target.txt里面。

举个例子:
sourse.txt里的数据:
2oi)4@##( "data:001%abc">dsi-23)(*32##("data:dce%xy3"#(*EOIj2308Eld

想提取的数据就是橘黄色的。
data:001%abc

全部提取出来以后,我还想把%换成*, 然后每条数据后面加个逗号","

最后target.txt就应该这样:

data:001*abc,
data:dce*xyz

请问应该怎么做啊?实在JAVA忘光了。求教~~

如果帮我做的话付点酬劳也可以。
以前我也面临过类似的问题,总是通过程序描述的办法解决,现在问题又提起来了,于是静下心来想一想。有了上学期330编译原理的基础,并且做过有限状态自动机以后,已经非常明确这种文字处理的事情应该交给Regular Expression(正则表达式),只不过自己总因为正则表达式晦涩难懂,因此没有好好的琢磨过。
于是我就打算借这个机会把Regular Expression好好的熟悉一下。结果发现程序原来如此好写:
using System;
using System.IO;
using System.Text;
using System.Text.RegularExpressions;

namespace RegExpression
{
    
/// <summary>
    ///
    /// </summary>
    
public class DataFilter
    
{
        
public static void Main(string[] args)
        {
            if(
args.Length < 2 )
            {
                
Console.Error.WriteLine("Please enter 2 filenames(e.g. In.txt Out.txt)");
                return;
            }
            
string Result;
            
using( StreamReader sr = new StreamReader(args[0]) )
            {
                
Result = Filter( sr.ReadToEnd() );
            }
            
using( StreamWriter wr = new StreamWriter(args[1]) )
            {
                
wr.Write(Result);
            }
        }
        
private static string Filter(string input)
        {
            
StringBuilder result = new StringBuilder();
            
Regex r = new Regex("/"(?<data>//w+):(?<key>//w+)%(?<value>//w+)/"", RegexOptions.Compiled);
            for(
Match m = r.Match(input); m.Success; m = m.NextMatch() )
            {
                
result.Append( m.Result("${data}:${key}*${value},"+Environment.NewLine) );
            }
            return
result.ToString();
        }
    }
}
实现这个功能的关键代码也就不超过10行就够了,一个字,爽。
略加修正:
·using statement
·end of line (Environment.NewLine)
·use StringBuilder to improve performence
这些要感谢cumcum给与指正。

正则表达式 Regular Expression

重新整理记录一下正则规则 定义 Regular Expression - 正规的/有规律的表达式,是计算机科学的一个概念。使用一个字符串来描述、匹配一系列符合某个句法规则的字符串 最...
  • u010297957
  • u010297957
  • 2016年04月05日 17:06
  • 687

正则表达式攻击实例 Regular Expressions Denial of Service

实测数据如下: 30个a,耗时175毫秒 35个a,耗时950毫秒 40个a,耗时11242毫秒...
  • kewen303
  • kewen303
  • 2015年08月26日 14:18
  • 1722

3.2 re--正则表达式操作(Regular expression operations)

本模块提供了正则表达式的匹配操作,它的功能跟Perl语言里的功能一样。 无论是Unicode字符串还是单字节8位组成的字符串,都可以使用模式匹配和字符串查找的功能。不过要注意的是Unicode字符串与...
  • caimouse
  • caimouse
  • 2015年07月12日 08:02
  • 1573

正则表达式(Regular Expression)基本语法

一、简介 为什么需要正则表达式? 文本的复杂处理正则表达式的优势和用途? 一种强大而灵活的文本处理工具; 大部分编程语言、数据库、文本编辑器、开发环境都支持正则表达式。正则表达式定义: 正如...
  • scgaliguodong123_
  • scgaliguodong123_
  • 2015年04月29日 22:00
  • 4148

正则表达式(regular expression)特殊字符(special charactors)1

注:文中例子使用Python中的正则表达式re模块。 1. 原意字符 正则表达中最基本的字符是单个原意字符。例如p中的’a',匹配s中的单个'a', 匹配位置在s中第一次出现a的位置。 >>...
  • bdss58
  • bdss58
  • 2015年01月31日 23:57
  • 701

Syntax error on token "Invalid Regular Expression Options", no accurate corr

1、选中报错的文件 2、右键选择 MyEclipse-->Exclude From Validation  3、再右键选择 MyEclipse-->Run Validation...
  • tianya9006
  • tianya9006
  • 2016年03月11日 16:36
  • 1529

leetcode 10 Regular Expression Matching(简单正则表达式匹配)

最近代码写的少了,而leetcode一直想做一个python,c/c++解题报告的专题,c/c++一直是我非常喜欢的,c语言编程练习的重要性体现在linux内核编程以及一些大公司算法上机的要求,pyt...
  • wangyaninglm
  • wangyaninglm
  • 2017年02月21日 01:19
  • 1056

工具分享--RegularExpressionTool(正则表达式测试工具)

最近翻电脑硬盘,意外发现了一个自己开发的正则测试工具。至从开发完该工具后,就一直很少使用它,比较可惜,现在把它开源出来分享给大家。下面是该工具的一些截图,发来给各位围观下:主界面 测试正则,能察看组捕...
  • ghostbear
  • ghostbear
  • 2013年03月11日 09:41
  • 2558

10. Regular Expression Matching-动态规划/递归回溯

mplement regular expression matching with support for '.' and '*'. '.' Matches any single character...
  • u011567017
  • u011567017
  • 2016年09月11日 21:40
  • 605

sed识别regular expression

小弟在sed使用中,对正则表达式有几个地方犯迷糊,为了彻底弄明白,试验之…… 特将结果呈与各位,请师兄们批评指正!也让初学者少走弯路。虽说有些问题在明白之后,感觉很简单,贴出来好像没必要;但在明白之前...
  • zhangbg
  • zhangbg
  • 2011年03月13日 18:17
  • 5182
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:Regular Expression 正则表达式-1 (C#)
举报原因:
原因补充:

(最多只允许输入30个字)