正则表达式 (?=) 正向先行断言

最近在练习正则表达式,遇到了一道很有意思的题,题目如下


我的答案如下

(?=.*?[A-Z])(?=.*?\d)(?=.*?[a-z]).{8,}

对于这个答案的理解得先从正向先行断言的语法开始说起。

正向先行断言的语法格式如下

expression1(?=expression2)
# 查找expression2前面的expression1

当然这个expression1也可以不写(也就是为空白符

例子如下

该正则表达式的意思为:寻找abcd字符串前的123456字符串。

这里也提一个有意思的地方

以上两个正则表达式中的/\d+/gm/123456/gm其实都能匹配123456这个字符串,但在正向先行断言中,前者会匹配每个数字前面的空白符,后者将123456字符串当成一个整体,只匹配这个整体前面的空白符。

这里面的原理还需要等我研究一下,估计是跟底层代码的实现有关,我猜测是(?=\d+)在匹配的时候会将每个数字单独提取出然后向前比较。


那么回到该题的答案中,先让我们看看 (?=.*?[A-z]) 是什么意思。

很明显上图匹配了大写字母A前面的所有空白符

其中的.*?[A-Z]代表大写字母及其前面的字符串且为懒惰匹配

那么(?=.*?[A-Z])(?=.*?\d)的意思就有点套娃了,按我的理解就是对于(?=.*?\d)而言把(?=.*?[A-Z])当成expression1,对于(?=.*?[A-Z])而言就是把空白符当成expression1

那么这个正则表达式就表示为:在寻找到每个大写字母前面的所有空白符的基础上还要满足:这些空白符都在每个数字前面的所有空白符这个匹配集合中。相当于是两个空白符集合的交集

所以(?=.*?[A-Z])(?=.*?\d)(?=.*?[a-z])相当于是每个大写字母、小写字母、数字前面的所有空白字符的交集

 而后面的.{8,}则匹配这些空白字符后面至少八位字符(贪婪匹配)

  • 4
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 6
    评论
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值