正则表达式30分钟入门教程

正则表达式30分钟入门教程

http://deerchao.net/tutorials/regex/regex-1.htm


. 匹配除换行符以外的任意字符
* 匹配重复任意次(可能是0次)
+ 匹配重复1次或更多次。
^ 匹配字符串的开始
$ 匹配字符串的结束
\b 匹配单词的开始或结束
\w 匹配字母或数字或下划线或汉字
\s \s匹配任意的空白符,包括空格,制表符(Tab),换行符,中文全角空格等
\d 匹配数字


.* 任意数量的不包含换行的字符
0\d{2}-\d{8} 以0开头,然后是两个数字,然后是一个连字号“-”,最后是8个数字;前面\d

必须连续重复匹配2次(8次)。
\ba\w*\b 以字母a开头的单词——先是某个单词开始处(\b),然后是字母a,然后

是任意数量的字母或数字(\w*),最后是单词结束处(\b)。
\d+ 匹配1个或更多连续的数字
\b\w{6}\b 匹配刚好6个字符的单词。

^\d{5,12}$ 一个网站如果要求你填写的QQ号必须为5位到12位数字时。
有些正则表达式处理工具还有一个处理多行的选项。如果选中了这个选项,^和$的意义就变成了

匹配行的开始处和结束处。
正则表达式引擎通常会提供一个“测试指定的字符串是否匹配一个正则表达式”的方法,
如JavaScript里的RegExp.test()方法或.NET里的Regex.IsMatch()方法。
这里的匹配是指是字符串里有没有符合表达式规则的部分。如果不使用^和$的话,对于\d{5,12}

而言,
使用这样的方法就只能保证字符串里包含5到12连续位数字,而不是整个字符串就是5到12位数字。


字符转义:
\.和\*,\\
例如:deerchao\.net匹配deerchao.net,C:\\Windows匹配C:\Windows。

重复

* 重复零次或更多次
+ 重复一次或更多次
? 重复零次或一次
{n} 重复n次
{n,} 重复n次或更多次
{n,m} 重复n到m次

Windows\d+ 匹配Windows后面跟1个或更多数字
^\w+ 匹配一行的第一个单词(或整个字符串的第一个单词,具体匹配哪个意思得看选项设置)

字符类
“(”和“)”也是元字符

如果你想匹配没有预定义元字符的字符集合-----你只需要在方括号里列出它们就行了

[aeiou] 就匹配任何一个英文元音字母,
[.?!] 匹配标点符号(.或?或!)。

指定一个字符范围
[0-9]代表的含意与\d就是完全一致的:一位数字。
[a-z0-9A-Z_]也完全等同于\w(如果只考虑英文的话):匹配一个字母或数字;

\(?0\d{2}[) -]?\d{8} 可以匹配几种格式的电话号码,像(010)88886666,或022-22334455,

或02912345678等。

首先是一个转义字符\(,它能出现0次或1次(?),然后是一个0,
后面跟着2个数字(\d{2}),然后是)或-或空格中的一个,它出现1次或不出现(?),最后是8个数字

(\d{8})

分枝条件

上面那个表达式也能匹配010)12345678或(022-87654321这样的“不正确”的格式。要解决这个问题,我们需要用到分枝条件。

分枝条件指的是有几种规则,如果满足其中任意一种规则都应该当成匹配。

0\d{2}-\d{8}|0\d{3}-\d{7} 
匹配两种以连字号分隔的电话号码:一种是三位区号,8位本地号(如010-12345678),一种是4位区号,7位本地号(0376-2233445)。


\(?0\d{2}\)?[- ]?\d{8}|0\d{2}[- ]?\d{8}
匹配3位区号的电话号码,其中区号可以用小括号括起来,也可以不用,((010)-12345678, )
区号与本地号间可以用连字号或空格间隔,也可以没有间隔。你可以试试用分枝条件把这个表达式扩展成也支持4位区号的。


\d{5}-\d{4}|\d{5} 用于匹配美国的邮政编码。美国邮编的规则是5位数字,或者用连字号间隔的


9位数字。
使用分枝条件时,要注意各个条件的顺序。如果你把它改成\d{5}|\d{5}-\d{4}的话,
那么就只会匹配5位的邮编(以及9位邮编的前5位)。原因是匹配分枝条件时,将会从左到右地测试
每个条件,如果满足了某个分枝的话,就不会去再管其它的条件了。


使用分枝条件时,要注意各个条件的顺序-----将会从左到右地测试每个条件,如果满足了某个分


枝的话,就不会去再管其它的条件了。


|-------------符号分开的表达式只要一个满足,就不看后面的表达式了


分组


重复单个字符(直接在字符后面加上限定符就行了)


((2[0-4]\d|25[0-5]|[01]?\d\d?)\.){3}
(2[0-4]\d|25[0-5]|[01]?\d\d?)


2[0-4]\d------匹配类似249的,中间可以为0-4;
25[0-5]------匹配类似255的,最后为只能为0-5;
[01]?\d\d?----匹配类似019,99等的;
{3}------------前面分组,重复3次;


反义


常用的反义代码


\W 匹配任意不是字母,数字,下划线,汉字的字符
\S 匹配任意不是空白符的字符
\D 匹配任意非数字的字符
\B 匹配不是单词开头或结束的位置
[^x] 匹配除了x以外的任意字符
[^aeiou] 匹配除了aeiou这几个字母以外的任意字符




\S+ 匹配不包含空白符的字符串。
<a[^>]+> 匹配用尖括号括起来的以a开头的字符串。


后向引用


http://deerchao.net/tutorials/regex/regex.htm




^#(.*)$  -------\1-----去掉每行开头的#


\b(.*)\b----#\1-----每行开头添加#


^(.*)$----#\1-------只在空白行,添加#


^\w*$-----------每行末尾


\"[0-9a-zA-Z]{14,16}----------------查找指定范围的的id,如"id" : "a15167c84cb858e";

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值