正则表达式

下面列举了一些常用的正则表达式,仅仅是为了方便记忆和查找:

1. 首先是元字符 ,究竟什么是元字符呢?大家就把它理解成是正则表达式的关键字吧,它代表的不是符号本身。

例如: 0/d{2,3}-/d{7,8} 表示电话号码,前面以 0 开头的 3 4 位数字,中间是 - ,后面 7 8 位数字 . 这里面 0 代表的就是数字 0 ,而 /d 是元字符代表的是一位数字, - 代表的也是本身。

常用的元字符如下表:

字符

说明

.

除了换行外的任意的字符

/b

单词的开始或结束(是一个位置)

/d

一个数字

/w

匹配字母、数字、下划线、汉字

/s

匹配空白符号

^

字符串的开始

$

字符串的结束

2. 转义字符 /

既然想 . 本身是不代表 . 的那么我要是想匹配 . 怎么办?那就要用到转义字符 /

例如 /. 就匹配 .

3. 重复

如果说你想匹配连续 5 个数字怎么办,写五个 /d 太麻烦了吧,事实上我们肯定不会那么做?我们可以使用 /d{5}.

常用的表重复的符号如下表:

字符

说明

*

重复 0 到多次

+

重复 1 到多次

重复零次或一次

{n}

重复 n

{n,

重复 n 到多次

{n,m}

重复 n m

4. 字符类 []

如何表示 abcd 中的任何一个呢,可以用: [abcd] 表示任意一个,不仅可以这样还可以用类似 [0-9] 表示 0 9 直接的任意的数字。

5. 分支条件 |

如果你要表示固定电话或者手机号码,因为固定电话是 0/d{3,4}-/d{7,8} 而手机号码是 /d{13} 。怎么办,这是可以用分支 0/d{3,4}-/d{7,8}|/d{13} 。用 | 分开,表示要么匹配前面类型要么匹配后面类型。

6. 分组 ()

上面说过重复一个字符 0 次、一次或多次,那么如何重复多个字符呢,就是我们要说的分组,例如要匹配一段 IP 地址 ( 简单的 IP 匹配 ) (/d{1,3}/.){3}/d{1,3}. 其中()括起来的部分重复 3 次。

7. 反义

上面说过匹配数字 /d, 那么如果想要匹配除了数字意外的字符呢?你可以使用 /D. 这就是要说的反义。

常用的反义:

字符

说明

/B

匹配不是单词的开始或结束位置

/D

不是数字的字符

/W

除字母、数字、汉字、下划线意外的字符

/S

不是空白字符的字符

[^x]

除了 x 以外的字符

[^abcd]

除了 abcd 以外的字符

8. 断言

如果我们匹配一个以 ch 结尾的单词的前半部分怎么办?可以: /b/w+(?=ch/b). 这个断言是出现在自身的后面叫零宽度正预测先行断言。要是匹配以 wr 开头单词的后半部分就可以是:(? =/bwr /w+/b, 这个叫零宽度正回顾后发断言。如果仅仅就是确保没有出现而不用去匹配,例如 /d{5}(?!/d) 就是匹配 5 个数字而且其后面不能再是数字,这种叫零宽度负预测先行断言;同样还有零宽度负回顾后发断言,例如 (?<![a-z])/d 前面不是小写字母的一个数字。

9. 懒惰限定符

如果有 a.*b 正则表达式,有字符 accccbccb 去匹配,达到的是 accccbccb 还是 accccb 呢?答案是前者,会找最长的。但是有时我们不希望这样,就可以使用懒惰限定符。比如上面的正则表达式可以这样 a.*?b 就可以解决问题了。

常用的有

字符

说明

*?

重复 0 到多次,但尽可能少的重复

+?

重复 1 到多次,但尽可能少的重复

??

重复 0 到一次,但尽可能少的重复

{n,m}?

重复 n m 次,但尽可能少的重复

{n}?

重复 n 到多次,但尽可能少的重复

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值