C#中有提供正则表达式功能的类Systrm.Text.RegularExpressions命名空间中的Regex类。Regex类中有个静态方法Matchs()就是用来匹配正则表达式的。
使用上面的功能之前必须使用System.Text.RegularExpressions的命名空间。
一、示例
string inputSource = //用@开头可以输出多行的字符串
@"
ressdd
reeee
sefs
re123
re we
";
const string regularExpress = "re.*"; //正则表达式
MatchCollection myMatchs = Regex.Matches(inputSource,regularExpress,RegexOptions.IgnoreCase|RegexOptions.ExplicitCapture); //正则匹配的结果集合即为MatchCollection
foreach (Match m in myMatchs) //轮询结果并将之输出
{
Console.WriteLine(m); //轮询结果并将之输出
}
二、Regex常用的方法
1、Match
表示匹配正则表达式的第一个匹配项
返回类型为Match
2、Matches
表示匹配正则表达式的所有匹配项
返回类型为MatchCollection。
3、IsMatch
表示是否有匹配成功的匹配项
返回类型为bool
三、RegexOptions
RegexOptions是表示匹配中需要设置的一些选项的枚举
它主要有下面几种:
1、CultureInvariant
指定忽略字符串的文化背景
2、ExplicitCapture
修改收集匹配的方式,方法是确保把显式指定的匹配作为有效的搜索结果。
3、IgnoreCase
忽略输入字符串的大小写
4、IgnorePatternWhitespace
在字符串中删除为转义的空白,启用通过#符号指定的注释
5、Multiline
修改字符^和$,把它们应用于每一行的开头和结尾,而不仅仅应用于一个单词的开头和结尾。
6、RightToLeft
从右到左的读取输入字符串,而不是默认的从左到右的读取,适用于一些亚洲语言或具有此特性的语言
7、Singleline
指定据点的含义(.),它原来表示单行模式,现在改为匹配每个字符,包括\n
四、带有\的匹配符处理
正则表达式中含有很多带有\的匹配符。例如\b,\w,\d等。为了在编程中防止编译器误判\为一般转义字符的话,可以在匹配之前加上@即可。
例如想要匹配数字的话用\d,但在编程中必须写成
const string patten=@“\d”;
再看下面的例子也是如此。
const string patten=@“\ba\S*ion\b”;
五、常见的字符或转义字符
关于常见的转义字符和匹配符的讲解请见C#正则表达式基础知识
六、匹配、组合、捕获
正则表达式可以将一些匹配模式组合起来
例如,如果想要匹配重复1次或多次的an字符时,可以写成(an)+
千万不能写成an+,虽然两者之间差了一个括号,但是结果往往不同。
an+会匹配ann,annn,annnn,annnnnn.
(an)+会匹配anan,ananan,anananan.