正则表达式学习与利器使用
一、学习:
正则表达式符号
字符 | 描述 |
/ | 标记下一个字符是特殊字符或文字。例如,"n" 和字符 "n" 匹配。"/n" 则和换行字符匹配。序列 "//" 和 "/" 匹配,而 "/(" 则和 "(" 匹配。 |
^ | 匹配输入的开头。 |
$ | 匹配输入的末尾。 |
* | 匹配前一个字符零或多次。例如,"zo*" 与 "z" 或 "zoo" 匹配。 |
+ | 匹配前一个字符一次或多次。例如,"zo+" 与 "zoo" 匹配,但和 "z" 不匹配。 |
? | 匹配前一个字符零或一次。例如,"a?ve?" 和 "never" 中的 "ve" 匹配。 |
. | 匹配除换行字符外的任何单个字符。 |
(pattern) | 匹配 pattern 并记住该匹配。匹配上的子字符串,可以使用 Item [0]...[n],来从生成的 Matches 集合中取回。要匹配圆括号字符 ( ),则需使用 "/(" 或 "/)"。 |
x|y | 匹配 x 或 y |
{n} | n 是非负整数。共匹配 n 次 |
{n,} | n 是一个非负整数。至少匹配 n 次。例如,"o{2,}" 和 "Bob" 中的 "o" 不匹配,但和 "foooood" 中的所有 o 匹配。"o{1,}" 与 "o+" 等效。"o{0,}" 和 "o*" 等效。 |
{n,m} | m 和 n 是非负整数。至少匹配 n 次而至多匹配 m 次。例如,"o{1,3}" 和 "fooooood" 中的前三个 o 匹配。"o{0,1}" 和 "o?" 等效。 |
[ | 字符集合。匹配括号内的任一字符。例如,"[abc]" 和 "plain" 中的 "a" 匹配。 |
[^xyz | 否定字符集合。匹配非括号内的任何字符。例如,"[^abc]" 和 "plain" 中的 "p" 匹配。 |
[a-z] | 字符范围。和指定范围内的任一字符匹配。例如,"[a-z]" 匹配 "a" 到 "z"范围内的任一小写的字母表字符。 |
[^m-z] | 否定字符范围。匹配不在指定范围内的任何字符。例如,"[m-z]" 匹配不在 "m" 到 "z"范围内的任何字符。 |
/b | 匹配字的边界,也就是说,在字和空格之间的位置。例如,"er/b" 和 "never" 中的 "er" 匹配,但和 "verb" 中的 "er" 不匹配。 |
/B | 匹配非字边界。"ea*r/B" 和 "never early" 中的 "ear" 匹配。 |
/d | 匹配数字字符。等价于 [0-9]。 |
/D | 匹配非数字字符。等价于 [^0-9]。 |
/f | 匹配换页字符。 |
/n | 匹配换行字符。 |
/r | 匹配回车符字符。 |
/s | 匹配任何空白,包括空格、制表、换页等。与 "[ /f/n/r/t/v]" 等效。 |
/S | 匹配任何非空白字符。与 "[^ /f/n/r/t/v]" 等效。 |
/t | 匹配制表字符。 |
/v | 匹配垂直制表符。 |
/w | 匹配包括下划线在内的任何字字符。与 "[A-Za-z0-9_]" 等效。 |
/W | 匹配任何非字字符。与 "[^A-Za-z0-9_]" 等效。 |
/num | 匹配 num,其中 num 是一个正整数。返回记住的匹配的引用。例如,"(.)/1" 匹配两个连续的同一字符。 |
/n | 匹配 n,其中 n 是八进制换码值。八进制换码值必须是 1、2、或 3 位长。例如,"/11" 和 "/011" 都匹配制表字符。"/0011" 和 "/001" & "1" 是等效的。八进制换码值必须不超过 256。如果超过了,则只有前两位组成表达式。允许在正则表达式中使用 ASCII 码。 |
/xn | 匹配 n,其中 n 是十六进制换码值。十六进制换码值必须正好是两位长。例如,"/x41" 与 "A" 匹配。"/x041" 和 "/x04" & "1" 是等效的。允许在正则表达式中使用 ASCII 码。 |
正则表达式中的特殊字符一览
〓简介〓 |
字符意义:对于字符,通常表示按字面意义,指出接着的字符为特殊字符,不作解释。 |
|
〓正文〓 |
字符 |
字符^ |
字符$ |
字符* |
字符+ |
字符? |
字符. |
字符(x) |
字符x|y |
字符{n} |
字符{n,} |
字符{n,m} |
字符[xyz] |
字符[^xyz] |
字符[b] |
字符b |
字符B |
字符cX |
字符d |
字符D |
字符f |
字符n |
字符r |
字符s |
字符S |
字符t |
字符v |
字符w |
字符W |
字符n |
字符ooctal和xhex |
二、几种正则表达式示例:
"^/d+$" //非负整数(正整数 + 0)
"^[0-9]*[1-9][0-9]*$" //正整数
"^((-/d+)|(0+))$" //非正整数(负整数 + 0)
"^-[0-9]*[1-9][0-9]*$" //负整数
"^-?/d+$" //整数
"^/d+(/./d+)?$" //非负浮点数(正浮点数 + 0)
"^(([0-9]+/.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*/.[0-9]+)|([0-9]*[1-9][0-9]*))$" //正浮点数
"^((-/d+(/./d+)?)|(0+(/.0+)?))$" //非正浮点数(负浮点数 + 0)
"^(-(([0-9]+/.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*/.[0-9]+)|([0-9]*[1-9][0-9]*)))$" //负浮点数
"^(-?/d+)(/./d+)?$" //浮点数
"^[A-Za-z]+$" //由26个英文字母组成的字符串
"^[A-Z]+$" //由26个英文字母的大写组成的字符串
"^[a-z]+$" //由26个英文字母的小写组成的字符串
"^[A-Za-z0-9]+$" //由数字和26个英文字母组成的字符串
"^/w+$" //由数字、26个英文字母或者下划线组成的字符串
"^[/w-]+(/.[/w-]+)*@[/w-]+(/.[/w-]+)+$" //email地址
"^[a-zA-z]+://(/w+(-/w+)*)(/.(/w+(-/w+)*))*(/?/S*)?$" //url
"^(/d{1,2}|1/d/d|2[0-4]/d|25[0-5])(/.(/d{1,2}|1/d/d|2[0-4]/d|25[0-5])){3}$" //IP地址
"^/d{4}-(0?[1-9]|1[0-2])-(0?[1-9]|[1-2]/d|3[0-1])$" //匹配日期格式2008-01-31,但不匹配2008-13-00
三、利器: