运算符示例
1 点运算符 .
.
是元字符中最简单的例⼦。
.
匹配任意单个字符,但不匹配换⾏符。
例如,表达式 .ar
匹配⼀个任意字符后⾯跟着是 a 和 r 的字符串。
".ar" => The car parked in the garage.
只匹配一个car
"/.ar/g" => The car parked in the garage.
当用//g
括起并用g结尾的时候,表示所有符合的都选择,即car、par、gar这三个。
2 字符集
字符集也叫做字符类。
⽅括号⽤来指定⼀个字符集。
在⽅括号中使⽤连字符来指定字符集的范围。
在⽅括号中的字符集不关⼼顺序。
例如,表达式 [Tt]he
匹配 the
和 The
。
"[Ttr]he" => The car parked in the garage rhe.
上面匹配符合的有The、the、rhe。
⽅括号的句号就表示句号。
表达式 ar[.]
匹配 ar.
字符串
"he[.]" => The car parked in the garage rhe.
3 否定字符集
⼀般来说 ^
表示⼀个字符串的开头,但它⽤在⼀个⽅括号的开头的时候,它表示这个字符集是否定的。
例如,表达式 [^c]ar
匹配⼀个后⾯跟着 ar
的除了 c
的任意字符。
4 重复次数
4.1 * 号
*
号匹配:在 *
之前的字符出现的次数大于等于0 次。
- 例如,表达式
a*
匹配0或更多个以a开头的字符。表达式[a-z]*
匹配⼀个⾏中所有以⼩写字⺟开头的字符串。
*
以空格分割出每一个单词,而以+
号结尾的
*
字符和 .
字符搭配可以匹配所有的字符 .*
。
*
和表示匹配空格的符号\s
连起来⽤,如表达式\s*cat\s*
匹配0或更多个空格开头的cat字符串(即前后的空格可有可没有都会匹配到)。
4.2 + 号
+
号匹配 +
号之前的字符出现 >=1 次。
例如表达式 c.+t
匹配以⾸字⺟ c 开头以 t 结尾,中间跟着⾄少⼀个字符的字符串。
- 不添加+号
- 添加+号
4.3 ?号
在正则表达式中元字符 ?
标记在符号前⾯的字符为可选,即出现 0 或 1 次。
例如,表达式 [T]?he
匹配字符串 he
和 The
。
4.4 {} 号
在正则表达式中 {}
是⼀个量词,常⽤来限定⼀个或⼀组字符可以重复出现的次数。
例如, 表达式 [0-9]{2,3}
匹配最少 2 位最多 3 位 0~9 的数字。
-
我们可以省略第⼆个参数。
[0-9]{2,}
表示匹配⾄少两位 0~9 的数字。 -
如果逗号也省略掉则表示重复固定的次数。
[0-9]{2}
匹配2位数字
4.5 (…) 特征标群
特征标群是⼀组写在 (...)
中的⼦模式。 (...)
中包含的内容将会被看成⼀个整体,和数学中⼩括号
-
( )
的作⽤相同。例如, 表达式(ab)*
匹配连续出现 0 或更多个 ab 。 -
如果没有使⽤
(...)
,那么表达式ab*
将匹配连续出现 0 或更多个 b 。 -
再⽐如之前说的
{}
是⽤来表示前⾯⼀个字符出现指定次数。但如果在{}
前加上特征标群(...)
则表示整个标群内的字符重复 N 次。
我们还可以在 ()
中⽤或字符 |
表示或。例如, (c|g|p)ar
匹配 car
或 gar
或 par
.
4.6 | 或运算符
或运算符就表示或,⽤作判断条件。
例如 (T|t)he|car
匹配 (T|t)he
或 car
。
4.7 \ 转码特殊字符
反斜线 \
在表达式中⽤于转码紧跟其后的字符。⽤于指定 { } [ ] / \ + * . $ ^ | ?
这些特殊字符。如果想要匹配这些特殊字符则要在其前⾯加上反斜线 \
。
例如 .
是⽤来匹配除换⾏符外的所有字符的。如果想要匹配句⼦中的 . 则要写成 \.
以下这个例⼦\.?
是选择性匹配 。
4.8 锚点
在正则表达式中,想要匹配指定开头或结尾的字符串就要使⽤到锚点。 ^
指定开头, $
指定结尾。
4.8.1 ^号
^
⽤来检查匹配的字符串是否在所匹配字符串的开头。
例如,在 abc
中使⽤表达式 ^a
会得到结果 a
。但如果使⽤ ^b
将匹配不到任何结果。因为在字符串abc
中并不是以 b
开头。
例如, ^(T|t)he
匹配以 The
或 the
开头的字符串。
4.8.2 $
号
同理于 ^
号, $
号⽤来匹配字符是否是最后⼀个。
例如, (at\.)$
匹配以 at.
结尾的字符串。