JavaScript正则表达式的分组匹配详解

本文深入探讨了JavaScript中的正则表达式分组匹配,包括基本的分组、候选、捕获与引用、与replace方法的配合、嵌套分组、反向引用等概念,并通过实例展示了它们的使用方法,如分组类型的非捕获型和前瞻型分组。文章还提到了正向前瞻和反向前瞻的匹配规则及其在实际应用中的作用。
摘要由CSDN通过智能技术生成

本文给大家详细介绍了JavaScript正则表达式的分组匹配的概念以及具体的使用方法并附上了相关示例,有需要的小伙伴可以参考下。

分组

下面的正则表达式可以匹配kidkidkid:

1

/kidkidkid/

而另一种更优雅的写法是:

1

/(kid){3}/

这里由圆括号包裹的一个小整体称为分组。

候选

一个分组中,可以有多个候选表达式,用|分隔:

1

2

3

4

5

6

var reg = /I love (him|her|it)/;

 

reg.test('I love him'// true

reg.test('I love her'// true

reg.test('I love it'// true

reg.test('I love them') // false

这里的|相当于“或”的意思。

捕获与引用

被正则表达式匹配(捕获)到的字符串会被暂存起来。其中,由分组捕获的串会从1开始编号,于是我们可以引用这些串:

1

2

3

4

5

6

7

var reg = /(\d{4})-(\d{2})-(\d{2})/

var date = '2010-04-12'

reg.test(date)

 

RegExp.$1 // 2010

RegExp.$2 // 04

RegExp.$3 // 12

$1引用了第一个被捕获的串,$2是第二个,依次类推。

与replace配合

String.prototype.replace方法的传参中可以直接引用被捕获的串。比如我们想将日期12.21/2012改为2012-12-21:

1

2

3

4

var reg = /(\d{2}).(\d{2})\/(\d{4})/

var date = '12.21/2012'

 

date = date.replace(reg, '$3-$1-$2') // date = 2012-12-21

顺道一提,给replace传迭代函数,有时能优雅地解决一些问题。

将违禁词转换为等字数的星号是一个常见功能。比如文本是kid is a doubi,其中kid与doubi是违禁词,那么转换后应该为*** is a *****。我们可以这么写:

1

2

3

4

5

6

var reg = /(kid|doubi)/g

var str = 'kid is a doubi'

 

str = str.replace(reg, function(word){

  return word.replace(/./g, '*')

})

嵌套分组的捕获

如果碰到类似/((kid) is (a (doubi)))/的嵌套分组,捕获的顺序是什么?来试试:

1

2

3

4

5

6

7

8

9

var reg = /((kid) is (a (doubi)))/

var str = "kid is a doubi"

 

reg.test( str ) // true

 

RegExp.$1 // kid is a doubi

RegExp.$2 // kid

RegExp.$3 // a doubi

RegExp.$4 // doubi

规则是以左括号出现的顺序进行捕获。

反向引用

正则表达式里也能进行引用,这称为反向引用:

1

2

3

4

5

6

var reg = /(\w{3}) is \1/

 

reg.test('kid is kid') // true

reg.test('dik is dik') // true

reg.test('kid is dik') // false

reg.test('dik is kid') // false

\1引用了第一个被分组所捕获的串,换言之,表达式是动态决定的。

注意,如果编号越界了,则会被当成普通的表达式:

1

2

3

4

var reg = /(\w{3}) is \6/;

 

reg.test( 'kid is kid' ); // false

reg.test( 'kid is \6' );  // true

分组的类型

分组有四种类型:

捕获型   - ()
非捕获型  - (?:)
正向前瞻型 - (?=)
反向前瞻型 - (?!)
我们之前说的都是捕获型分组,只有这种分组会暂存匹配到的串。

非捕获型分组

有时候,我们只是想分个组,而没有捕获的需求,则可以使用非捕获型分组,语法为左括号后紧跟?::

1

2

3

4

5

6

var reg = /(?:\d{4})-(\d{2})-(\d{2})/

var date = '2012-12-21'

reg.test(date)

 

RegExp.$1 // 12

RegExp.$2 // 21

这个例子中,(?:\d{4})分组不会捕获任何串,所以$1为(\d{2})捕获的串。

正向与反向前瞻型分组

就好像你站在原地,向前眺望:

正向前瞻型分组 - 你前方是什么东西吗?
负向前瞻型分组 - 你前方不是什么东西吗?
太拗口了,我喜欢称之为肯定表达式与否定表达式。先举个正向前瞻的例子:

1

2

3

4

var reg = /kid is a (?=doubi)/

 

reg.test('kid is a doubi') // true

reg.test('kid is a shabi') // false

kid is a 后面跟着什么?如果是doubi才能匹配成功。

而负向前瞻则刚好相反:

1

2

3

4

var reg = /kid is a (?!doubi)/

 

reg.test('kid is a doubi') // false

reg.test('kid is a shabi') // true

如果前瞻型分组也不会捕获值。那么它与非捕获型的区别是什么?看例子:

1

2

3

4

5

6

7

8

9

var reg, str = "kid is a doubi"

 

reg = /(kid is a (?:doubi))/

reg.test(str)

RegExp.$1 // kid is a doubi

 

reg = /(kid is a (?=doubi))/

reg.test(str)

RegExp.$1 // kis is a

可见,非捕获型分组匹配到的串,仍会被外层的捕获型分组捕获到,但前瞻型却不会。当你需要参考后面的值,又不想连它一起捕获时,前瞻型分组就派上用场了。

最后,JS不支持后瞻型分组。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值