所述内容仅以JavaScript中的规则为例
基础知识
- 请点击查看MDN中关于正则表达式的基础知识
- 占有字符:子表达式匹配到的是字符内容,而非位置,并被保存到最终匹配结果中。
- 零宽度:子表达式匹配的仅仅是位置,匹配到的内容不保存到最终结果中。
- 控制权:正则表达式在匹配时,由左向右依次进行匹配。通常情况下,下一个子表达式从上一个子表达式匹配结束之后的位置开始匹配,但是如果前一个子表达式是零宽度子表达式,那么当前的子表达式匹配的起始位置和前一个表达式匹配的起始位置相同。
- 占有字符是互斥的,零宽字符不是互斥的(一个字符同一时间,只能由一个子表达式匹配;一个位置同一时间,可由多个零宽度的子表达式匹配)。
常用规则
贪婪和非贪婪模式(greedy)
- 贪婪模式:在使用
+、*、?、{m,n}
等与重复次数相关的语法时,正则表达式在匹配时,会匹配到尽可能多的内容,如:/a{1,3}/.exec('aaa')
匹配到的是:aaa - 非贪婪模式:在与重复次数相关的修饰符之后添加
?
后,正则表达式在匹配时,会匹配到尽可能少的内容,如:/a{1,3}?/.exec('aaa')
匹配到的是:a
零宽断言(环视)
- 正向肯定断言:
(?=exp)
,所在位置的右侧需匹配exp
指定的格式要求,如:/aa(?=\.exe)/.exec('aa.exe') // aa
, - 正向否定断言:
(?!exp)
,所在位置的右侧不能匹配exp
指定的格式要求,如:/aa(?!\.exe)/.exec('aa11') // aa
- 反向肯定断言:
(?<=exp)
,所在位置的左侧需匹配exp
指定的格式要求,如:/(?<=aa)\.exe/.exec('aa.exe') // .exe
- 反向否定断言:
(?<!exp)
,所在位置的左侧不能匹配exp
指定的格式要求,如:/(?<!aa)\.exe/.exec('bb.exe') // .exe
特别注意:
1. 零宽断言的子表达式匹配到的内容不会加入到最终的匹配结果中,且紧跟零宽断言之后的子表达式匹配的起始位置与零宽断言的子表达式匹配的起始位置相同
1. 反向断言在JavaScript中并不支持(截止2018年1月4日),在 JavaScript 中应避免使用
反向引用
在正则表达式后面的子表达式中,直接引用前面的捕获组所匹配到的内容,如:
/^a(a)b\1$/.test('aaba') // true
,其中\1
的值是第一个子匹配的内容a