let str = “https://www.baidu.com/s?query=javascript”
str.match(pattern) //返回 [‘query=javascript’, ‘javascript’]
在这个例子中,我们很明确的知道我们只是想获取 query=
后面的字符串,但是如果我们直接用这个模式 /query=[a-zA-Z]+/
去匹配的话,我们最后只能获得 query=javascript
这样一整段字符串。所以我们可以在我们可以使用小括号来定义一个子匹配模式,这样在返回的数组中直接获取小括号匹配返回的值就可以了。
- 作用三:小括号定义的子匹配模式可以被反斜杠+数字再次引用
其实作用三是在作用二的基础上的,我们可以通过一个反斜杠 \
加上数字 n来引用该匹配模式中第n个括号定义的子匹配模式,例如 /java(script)\1/
,这个意思就是 \1
的部分需要匹配的字符串要跟(script)
一样
let pattern = /java(\d+)\1/
let str = “java123123”
str.match(pattern) //返回 [‘java123123’, ‘123’]
在这个例子中,\1
对(\d+)
进行了一次引用,注意是引用,而不是这样 /java(\d+)(\d+)/
。我们来看一下这两者的区别
/----------------使用反斜杠加数字引用----------------/
let pattern = /java(\d+)\1/
let str = “java123321”
str.match(pattern) //返回 null
/----------------完全的重复一遍子匹配模式----------------/
let pattern = /java(\d+)(\d+)/
let str = “java123321”
str.match(pattern) //返回 [‘java123321’, ‘12332’, ‘1’]
通过这两个例子的对比,我们可以发现以下几点区别:
-
子匹配模式
必须和反斜杠+数字
匹配到的字符串一模一样,否则匹配失败 -
两个相同的子匹配模式则不需要两者匹配到一模一样的字符串
-
反斜杠+数字
虽然是对定义的子匹配模式的引用,但在匹配返回的结果里,却不会返回反斜杠+数字
匹配到的内容
补充:如果我们用小括号定义的子匹配模式不想被反斜杠+数字
引用,我们可以在小括号内部的最前面加上 ?:
,即这种形式 (?:\d+)
,这样的话我们就无法在后面使用 反斜杠+数字
来引用这个子匹配模式了。
例如:
let pattern = /java(?:script)(\d+)\1/
let str = “javascript1212”
str.match(pattern) //返回 [‘javascript1212’, ‘12’]
例子中我们可以看到, \1
是对第二个子匹配模式(\d+)
进行了引用,其实我们可以这样理解,使用这种形式(?:...)
定义的子匹配模式,不会被计入编号中,所以也不会被 反斜杠+数字
引用。
[](()指定匹配位置
在正则表达式中,我可以利用某些字符,去指定匹配发生的位置。这些字符我们称之为正则表达式的锚。
| 字符 | 含义 |
| — | — |
| ^ | 匹配字符串的开头 |
| $ | 匹配字符串的结尾 |
| \b | 匹配一个单词的边界 |
| \B | 匹配非单词边界的位置 |
| (?=p) | 零宽正向先行断言,?=后面的字符都要与p匹配,但不能包括p的那些字符 |
| (?!p) | 零宽负向先行断言,?!后面的字符不与p匹配 |
我们来逐个说一下这几个字符的用法:
- ^ 符号
^ 这个符号是将匹配位置定位到字符串的开头,直接来看一个例子
/--------------------------第一种情况--------------------/
let pattern = /^javascript/
let str = “javascript is fun”
str.match(pattern) //返回 [‘javascript’]
/--------------------------第二种情况-----------