1.^,$或\b and \B
开头开始匹配: ^或\A
结尾 :$或\z
\b and \B :
\b 匹配的模式是一个单词边界,就是说,与之对应的模式一定在一个单词的开头 .
\B 只匹配出现在一个单词中间的模式.
the 任何包含有"the"的字符串
\bthe 任何以"the"开始的字符串
\bthe\b 仅匹配单词 “the”
\Bthe 任意包含“the”但不以“the”开头的单词
2.指定范围 ( - ) 和 否定( ^ )
3.使用闭包操作符 ( *, +, ?, {} ) 实现多次出现/重复匹配
加号(+)操作符匹配它左边那个正则表达式模式至少出现一次的情况
问号操作符( ? )匹配它左边那个正则表达式模式出现零次或一次的情况。
花括号操作符({ }), 花括号里可以是单个的值,也可以是由逗号分开的一对值。如果是
一个值,如,{N},则表示匹配N 次出现;如果是一对值,即,{M, N},就表示匹配M 次到N 次出现。
4.特殊字符表示字符集
\d 表示十进制数字 (“0–9”这个范围)
\w 可用来表示整个 字符数字的字符集,即相当于“A-Za-z0-9_”的简写形式
“\s” 代表空白字符
这些特殊字符的大写形式表示不匹配,比如,“\D” 表示非十进制数字的字符(等价于 “[^0-9]”)
5.一对圆括号(()) 和正则表达式一起使用时可以实现以下任意一个(或两个)功能:
1) 对正则表达式进行分组
2) 匹配子组
6.原始字符串的产生正是由于有正则表达式的存在。原因是ASCII 字符和正则表达式特殊字符间所产生的冲突。比如,特殊符号“\b”在ASCII 字符中代表退格键,但同时“\b”也是一个正则表达式的特殊符号,代表“匹配一个单词边界”。为了让RE 编译器把两个字符“\b”当成你想要表达的字符串,而不是一个退格键,你需要用另一个反斜线对它进行转义,即可以这样写:“\\b”。
7.“.+”来表示任意个字符集