开发工具与关键技术: VS MVC基础
作者:卢雅婷
撰写时间:2019/06/07
(相关资料来源于老师文档)
,其实对于正则表达式的用处很多,有很多方面,常见的有身份证号的验证、手机号码的验证、密码的验证和图片的验证等等,从开始简单的数字验证到含有不同字符的图片验证,。都是由正则表达式完成的。哪正则表达式到底是什么?
在编写处理字符串的程序或网页时,经常会有查找符合某些复杂规则的字符串的需要。正则表达式就是用于描述这些规则的工具。换句话说,正则表达式就是记录文本规则的代码。
1.首先我们要了解一下正则表达式的基础概念。下面是常用元字符的说明,
. 匹配换行符以外的任意字符
\w 匹配数字或字母或下划线或汉字
^ 匹配字符串的开始
\s 匹配任意的空白符
\d 匹配数字
\b 匹配单词的开始或结束
$ 匹配字符串的结束
2.有时需要查找不属于某个能简单定义的字符类的字符。比如想查找除了数字以外,其它任意字符都行的情况,这时需要用到反义:
\W 匹配任意不是字母,数字,下划线,汉字的字符
\S 匹配任意不是空白符的字符
\D 匹配任意非数字的字符
\B 匹配不是单词开头或结束的位置
[^x] 匹配除了x以外的任意字符
[^aeiou] 匹配除了aeiou这几个字母以外的任意字符
3.接下来的四个用于查找在某些内容(但并不包括这些内容)之前或之后的东西,也就是说它们像\b,^,$那样用于指定一个位置,这个位置应该满足一定的条件(断言),因此它们也被称为零宽断言。
(?=exp)也叫零宽度正预测先行断言
(?<=exp)也叫零宽度正回顾后发断言
(?=exp),简单来说就是比如\b\w+(?=ing\b),匹配以ing结尾的单词的前面部分(除了ing以外的部分),而(?<=exp) 比如(?<=\bre)\w+\b会匹配以re开头的单词的后半部分(除了re以外的部分)。
接着要说的还有两种匹配方法,贪婪与懒惰。
4.当正则表达式中包含能接受重复的限定符时,通常的行为是(在使整个表达式能得到匹配的前提下)匹配尽可能多的字符。考虑这个表达式:a.b,它将会匹配最长的以a开始,以b结束的字符串。如果用它来搜索aabab的话,它会匹配整个字符串aabab。这被称为贪婪匹配。
而另一种就是贪婪匹配了,就是匹配尽可能少的字符。前面给出的限定符都可以被转化为懒惰匹配模式,只要在它后面加上一个问号?。这样.?就意味着匹配任意数量的重复,如下图限定符。
以上的内容都是普遍出现的正则表达式的基础元字符等,但如何忽略大小写,处理多行等,这些选项能用来改变处理正则表达式的方式。下面是.Net中常用的正则表达式选项:
IgnoreCase(忽略大小写):匹配时不区分大小写。
Multiline(多行模式): 更改^和 的 含 义 , 使 它 们 分 别 在 任 意 一 行 的 行 首 和 行 尾 匹 配 , 而 不 仅 仅 在 整 个 字 符 串 的 开 头 和 结 尾 匹 配 。 ( 在 此 模 式 下 , 的含义,使它们分别在任意一行的行首和行尾匹配,而 不仅仅在整个字符串的开头和结尾匹配。(在此模式下, 的含义,使它们分别在任意一行的行首和行尾匹配,而不仅仅在整个字符串的开头和结尾匹配。(在此模式下,的精确含意是:匹配\n之前的位置以及字符串结束前的位置.)
Singleline(单行模式):更改.的含义,使它与每一个字符匹配(包括换行符\n)。
等等,在此我就不一一列举了,构造正则表达式的大量元素,还有一些我没有提到的东西。。你可以在网上找到更详细的参考资料来学习它们–当你需要用到它们的时候。如果你安装了MSDN Library,你也可以在里面找到关于.net下正则表达式详细的文档。要先学习好正则表达式,其的基础知识也是不可忽视的。
鄙人学之尚浅,如有不对之处,请给予矫正,感谢阅读。