正则表达式
常用元字符
代码 | 说明 |
---|---|
. | 匹配除换行符以外的任意字符 |
\w | 匹配字母数字下划线汉字 |
\s | 匹配任意空白符 |
\d | 匹配任意数字 |
\b | 匹配单词的开始或结束 |
^ | 匹配字符串的开始 |
$ | 匹配字符串的结束 |
? | 出现零次(不出现)或一次 |
+ | 出现一次或者更多次 |
字符转义
代码 | 说明 |
---|---|
. | \. |
* | \* |
\ | \\ |
常用案例
输入 | 输出(说明) |
---|---|
c:\\windows | c:\windows |
baidu.com | baidu.com |
(010)88886666,或022-22334455,或02912345678 | (?0\d{2}[) -]?\d{8} |
字符长度位5-12个随机数字 | ^\d{5,12}$ |
分枝条件
不幸的是,刚才那个表达式也能匹配010)12345678或(022-87654321这样的“不正确”的格式。要解决这个问题,我们需要用到分枝条件。正则表达式里的分枝条件指的是有几种规则,如果满足其中任意一种规则都应该当成匹配,具体方法是用|把不同的规则分隔开。听不明白?没关系,看例子:
0\d{2}-\d{8}|0\d{3}-\d{7}这个表达式能匹配两种以连字号分隔的电话号码:一种是三位区号,8位本地号(如010-12345678),一种是4位区号,7位本地号(0376-2233445)。
\(0\d{2}\)[- ]?\d{8}|0\d{2}[-]?\d{8}这个表达式匹配3位区号的电话号码,其中区号可以用小括号括起来,也可以不用,区号与本地号间可以用连字号或空格间隔,也可以没有间隔。你可以试试用分枝条件把这个表达式扩展成也支持4位区号的。
\d{5}-\d{4}|\d{5}这个表达式用于匹配美国的邮政编码。美国邮编的规则是5位数字,或者用连字号间隔的9位数字。之所以要给出这个例子是因为它能说明一个问题:使用分枝条件时,要注意各个条件的顺序。如果你把它改成\d{5}|\d{5}-\d{4}的话,那么就只会匹配5位的邮编(以及9位邮编的前5位)。原因是匹配分枝条件时,将会从左到右地测试每个条件,如果满足了某个分枝的话,就不会去再管其它的条件了。
分组
怎么重复单个字符(直接在字符后面加上限定符就行了);但如果想要重复多个字符又该怎么办?你可以用小括号来指定子表达式(也叫做分组),然后你就可以指定这个子表达式的重复次数了,你也可以对子表达式进行其它一些操作(后面会有介绍)。
(\d{1,3}.){3}\d{1,3}是一个简单的IP地址匹配表达式。要理解这个表达式,请按下列顺序分析它:\d{1,3}匹配1到3位的数字,(\d{1,3}.){3}匹配三位数字加上一个英文句号(这个整体也就是这个分组)重复3次,最后再加上一个一到三位的数字(\d{1,3})。
反义
代码 | 说明 |
---|---|
\D | 匹配除数字外的字符 |
\W | 匹配除汉字字母数字下划线外的字符 |
\S | 匹配任意不是空白的字符串 |
\B | 匹配不是开头或结尾的位置 |
\[^x] | 匹配除了X以外的任意字符 |
[^aeiou] | 匹配除了aeiou这几个字母以外的任意字符 |
个人反思
- 数据库中 like 模糊查询和正则表达式的异同;
- mysql数据库中 使用 regexp 关键字通过正则表达式进行模糊查询,sqlserver是否试用;
[更新日期:20180628]