正则

正则

开发工具与关键技术:
作者:熊琪
撰写时间:2019.04.24

在编写处理字符串的程序或网页时,经常会有查找符合某些复杂规则的字符串的需要。正则表达式就是用于描述这些规则的工具。换句话说,正则表达式就是记录文本规则的代码。
正则表达式是用于进行文本匹配的工具,所以本文里多次提到了在字符串里搜索/查找,这种说法的意思是在给定的字符串中,寻找与给定的正则表达式相匹配的部分。有可能字符串里有不止一个部分满足给定的正则表达式,这时每一个这样的部分被称为一个匹配。匹配在本文里可能会有三种意思:一种是形容词性的,比如说一个字符串匹配一个表达式;一种是动词性的,比如说在字符串里匹配正则表达式;还有一种是名词性的,就是刚刚说到的“字符串中满足给定的正则表达式的一部分”。(来自http://unibetter.com/deerchao/zhengzhe-biaodashi-jiaocheng-se.htm#getstarted

正则的运用特别的广泛,首先我们来看一下常用的元字符有哪些:
(.)匹配除换行符以外的任意字符
(\w) 匹配字母或数字或下划线或汉字
(\s) 匹配任意的空白符
(\d) 匹配数字
(\b) 匹配单词的开始或结束
(^)匹配字符串的开始
($)匹配字符串的结束

在这里插入图片描述
除换行符以外的任意字符都能够匹配,大概意思就是这样,正则可以运用在很多地方,比如身份证的正则验证,身份证有两种格式一种是15位数组成,另外一种是18位数的,除了这个以外还分平年和闰年的匹配,因为身份证的正则匹配比较严格所以也相对来说比较复杂,简单的呢也有就直接匹配身份证的简单形式比如:
\b[0-9]{6}(?:19|20)[0-9]{2}(?:0[1-9]|1[0-2])(?:0[1-9]|[12][0-9]|3[01])[0-9]{4}\b
首先\b是正则表达式规定的一个特殊代码,我们把它叫做元字符,单词的开头或结尾,也就是单词的分界处,它只匹配一个位置,然后[0-9]查找任何从0至9的数字,{6}重复6次,到这等于字符串的前六位已经匹配完了,身份证第七位和第八位是年份的千位数和百位数比如1949年和2008年匹配19或20,不捕获匹配的文本,也不给此分组分配组号.接着就是第九和第十位数字[0-9]{2}也就是我们说的几几年,接着就是身份证的月分当月分时1-9月时在身份证号中都是要加个0在前面的,当月份是10-12月份时就第一位是可以确定是1所以就正则匹配可以写成(?:0[1-9]|1[0-2]),月匹配完后就是号了,同样的分为三类第一类是各位数第二类是从十到二十九,第三类就是三十号到三十一号,本来年中是分闰年和平年的简单的我们不做匹配但要了解的是每年的4,6,9,11这四个月是没有31号的所以细的判断是要用到这个法则的,简单匹配九可以写成:(?:0[1-9]|[12][0-9]|3[01]),最后还剩四位数前三位是随机生成的数字,最后一位是0-9数字或者是大小写的X,正则匹配写法:[0-9]{3}[0-9Xx]$,而这里考虑的好不够细。匹配如图:
在这里插入图片描述
如图中的第一个位正确形式的身份证号码,后两个都是错误的写法第二个是年份开始出错省份证年份匹配的是1900年及以后的,第三个则是月份匹配错误,不存在13月。
除了常用的·元字符之外还有限定符,反义代码,分组语法等常用的也就这几种了,这里介绍下反义:\W 匹配任意不是字母,数字,下划线,汉字的字符
\S 匹配任意不是空白符的字符
\D 匹配任意非数字的字符
\B匹配不是单词开头或结束的位置
[^x] 匹配除了x以外的任意字符
[^aeiou] 匹配除了aeiou这几个字母以外的任意字符
大写与小写的意思恰好相反。在上诉身份证匹配时也有遇到替换,在正则表达式当中的替换指的是有几种规则,如果满足其中任意一种规则都应该当成匹配,比如图中所示:

在这里插入图片描述
当其中一种满足时都当成匹配,具体的方法就是用 | 把不同的规则分开,使用替换时,顺序是很重要的。
基本常用到的方法还有分组语法零宽断言,贪婪与懒惰。用于查找在某些内容(但并不包括这些内容)之前或之后的东西,也就是说它们像\b,^,$那样用于指定一个位置,这个位置应该满足一定的条件(断言),因此它们也被称为零宽断言。贪婪:当正则表达式中包含能接受重复的限定符时,通常的行为是(在使整个表达式能得到匹配的前提下)匹配尽可能多的字符。懒惰:有时,我们更需要懒惰匹配,也就是匹配尽可能少的字符。如果将前面给出的限定符转化为懒惰匹配模式,只要在它后面加上一个问号?。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值