1.字符边界(匹配的不是字符而是位置,符合某种条件的位置,零宽度)
^ 与字符串开始的地方开始匹配
$ 与字符串结束的地方匹配
\b 匹配一个单词边界
2.选择符和分组
| 分支结构 左右两边表达式之间“或”关系,匹配左边或者右边
() 捕获组 (1).在被修饰匹配次数的时候,括号中的表达式可以作为整体被修饰
(2).取匹配结果的时候,括号中的表达式匹配到的内容可以被单独得到
(3).每一对括号会分配一个编号,使用()的捕获根据左括号的顺序从1开始自动编号。捕获元素编号为零的第一个 捕获是由整个正则表达式模式匹配的文本
(?:Expression) 非捕获组 不常用
3.反向引用
\nnn
每一对()会分配一个编号,使用()的捕获根据左括号的顺序从1开始自动编号
通过反向引用,可以对分组已经捕获的字符串进行引用
4.预搜索(零宽断言,匹配的是位置)
(?=exp) 断言自身出现的位置的后面能匹配表达式exp
(?!exp) 断言此位置的后面不能匹配表达式exp
(?<=exp) 断言自身出现的位置的前面能匹配表达式exp
(?<!exp) 断言此位置的前面不能匹配表达式exp
-------------------------------------------------------------------------------------------------------------------------------------------------------------------------
补充一点基础
标准字符集合
\d 任意一个数字,o~9中的任意一个
\w 任意一个字母或数字或下划线,也就是A~Z,a~z,0~9,_中任意一个
\s 包括空格、制表符、换行符等空白字符的其中任意一个
. 小数点可以匹配任意一个字符,如果要匹配包括“\n”在内的所有字符,一般用[\s\S]
自定义字符集合
[]方括号匹配方式,能够匹配方括号中任意一个字符
[ab5@] 匹配"a"或"b"或"5"或"@"
[^abc] 匹配“a”,“b”,“c”之外的任意一个字符
[f-k] 匹配“f”~“k”之间的任意一个字母
[^A-F0-3] 匹配“A”~“F”,“0”~“3”之外的任意一个字符
正则表达式的特殊符号被包含到中括号中,则失去了特殊意义,除了^,-之外
标准字符集合,处小数点外,如果被包含于中括号中,自定义字符集合将包含该集合。比如:
[\d.\-+]将匹配:数字、小数点,-,+
量词
修饰匹配次数的特殊符号
{n} 表达式重复n次
{m,n} 表达式至少重复m次,最多重复n次
{m,} 表达式至少重复m次
? 匹配表达式0次或1次,相当于{0,1}
+ 表达式至少出现一次,相当于{1,}
* 表达式不出现或出现任意次数,相当于{0,}
默认贪婪模式,非贪婪模式要在后面加一个"?"号