书写格式
要使用正则表达式,第一步当然是要“写”了,那么怎么写呢?一共有两种格式:
双引号(")中的部分就是正则表达式了(暂时先不用关心本表达式的含义)。
仔细观察的话,我们会发现第一种方式中的 \\d 在第二中方式中写成了 \d,OK,这就是两种书写方式的区别了。
在第一种书写方式中,由于斜杠(\)字符在正则表达式中有别的作用,所以直接写的话是不行了,所以要用两个斜杠(\\)来代表一个斜杠(\),这就是传说中的“转义”。
但是这样很麻烦,如果一个正则表达式中要用到多个 \,岂不是要写一堆 \\?于是就出现了第二种方式。
第二种方式在表达式的前面加一个 @ 字符,有了这个字符,就表明后面表达式中的 \ 可以直接翻译成 \,而不用转义了,这样就方便多了。
本文中的例子,都将使用第二种方式来书写(不包含 " 和 @ 符号),上面的第二种方法,在本文中将写成 \d{1,6}-\d*,以方便观察及理解。
接下来就可以使用 .NetFramework 提供的正则表达式接口函数 Regex.Matches() 来进行搜索了(请注意使用 using System.Text.RegularExpressions 命名空间)。