正则中的全局模式

今天在使用js的test函数进行正则匹配时,发生了一个奇怪的问题,程序的运行结果显示总有一些字符串无法被匹配,即使它们“长得”和那些成功匹配的字符串非常相似。这些字符串示例如下:'%(ALLUSERSPROFILE)%'、'%(HOMEDRIVE)%'、'%(CommonProgramFiles)%'、'%(ProgramData)%'...等,指定的正则表达式为/%\(|\)%/g。

 

如上面所示的字符串,前三个都可以被成功匹配,而第四个就无法匹配成功了。最开始以为是字符串中包含非法字符或编码问题,于是将第四个字符串放到第一个,结果却显示匹配成功。

 

无意中将正则中的全局标志'g'删除,结果显示之前匹配不成功的字符串也被成功匹配了。很明显,问题的所在之处就是这个全局标志'g'。

 

后经查阅资料得知,如果为正则指定了全局标志,那么正则匹配会在全局模式下进行。全局模式下会有一个名为“lastIndex”的属性,该属性可能会对后续的匹配操作产生影响。因为其值的含义是上一次匹配成功时,匹配位置之后下一个字符的位置。如果没有匹配成功,该值被赋予0。该值的默认值也是0,故第一次匹配总是从字符串的[0]下标处开始进行。

 

结合实例分析下:第一个字符串为'%(ALLUSERSPROFILE)%',由于符合的匹配项“%(”位于[0]、[1]下标处,匹配成功之后,lastIndex值为2,故第二个字符串进行匹配时是从[2]处开始的。第二个字符串'%(HOMEDRIVE)%'的匹配项是“%)”,位于[11]、[12]处,故第三个字符串从[13]处开始,即lastIndex值为13。第三个字符串'%(CommonProgramFiles)%'的匹配项为“%)”,位于[20]、[21],故第四个字符串要从[22]处开始。而第四个字符串全长度也不够22,所以...匹配失败。附图一张,可以看到每次匹配之前和之后lastIndex的变化。其中每行第一个数字代表第几个字符串,第二个数字代表lastIndex值。

 

明白了问题的原因,解决方法也显而易见了,将正则中的全局标志'g'去掉即可。

转载于:https://www.cnblogs.com/gdzr/p/3794784.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值