正则表达式 (?=) 正向先行断言

原创已于 2022-03-09 17:33:39 修改 · 3.6k 阅读

·

4

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#正则表达式

于 2022-03-09 17:33:08 首次发布

正则表达式专栏收录该内容

4 篇文章

订阅专栏

本文探讨了一道关于正则表达式的练习题，解释了正向先行断言的原理，并详细分析了给定答案的含义。通过实例展示了如何使用正则表达式寻找大写字母、数字和小写字母前的空白字符交集，并匹配后续至少8个字符。文章深入浅出地阐述了正则表达式的懒惰匹配和集合交集的概念。

最近在练习正则表达式，遇到了一道很有意思的题，题目如下

我的答案如下

(?=.*?[A-Z])(?=.*?\d)(?=.*?[a-z]).{8,}

对于这个答案的理解得先从正向先行断言的语法开始说起。

正向先行断言的语法格式如下

expression1(?=expression2)
# 查找expression2前面的expression1

当然这个expression1也可以不写（也就是为空白符）

例子如下

该正则表达式的意思为：寻找abcd字符串前的123456字符串。

这里也提一个有意思的地方

以上两个正则表达式中的/\d+/gm和/123456/gm其实都能匹配123456这个字符串，但在正向先行断言中，前者会匹配每个数字前面的空白符，后者将123456字符串当成一个整体，只匹配这个整体前面的空白符。

这里面的原理还需要等我研究一下，估计是跟底层代码的实现有关，我猜测是(?=\d+)在匹配的时候会将每个数字单独提取出然后向前比较。

那么回到该题的答案中，先让我们看看 (?=.*?[A-z]) 是什么意思。

很明显上图匹配了大写字母A前面的所有空白符

其中的.*?[A-Z]代表大写字母及其前面的字符串且为懒惰匹配

那么(?=.*?[A-Z])(?=.*?\d)的意思就有点套娃了，按我的理解就是对于(?=.*?\d)而言把(?=.*?[A-Z])当成expression1，对于(?=.*?[A-Z])而言就是把空白符当成expression1。

那么这个正则表达式就表示为：在寻找到每个大写字母前面的所有空白符的基础上还要满足：这些空白符都在每个数字前面的所有空白符这个匹配集合中。相当于是两个空白符集合的交集。

所以(?=.*?[A-Z])(?=.*?\d)(?=.*?[a-z])相当于是每个大写字母、小写字母、数字前面的所有空白字符的交集。

而后面的.{8,}则匹配这些空白字符后面至少八位字符（贪婪匹配）。

6 条评论

焦海江 2023.03.19
我这两天刚好看这个正向先行断言，你理解的感觉有偏差，正向先行断言不消耗字符，主要是这个特性。
- 枫叶思念回复焦海江 2024.06.10
  正解
- 焦海江回复焦海江 2023.03.19
  (?=.*?[A-Z])(?=.*?\d)(?=.*?[a-z]) 这个表达式，每个断言完成后，都不消耗字符，所以回到了开始位置，也就是字符串开头

刘承瑜 2022.10.19
用的哪个在线正则验证工具啊
- AdamShyly回复刘承瑜 2022.10.19
  https://regex101.com/

liu7132 2022.06.17
谢谢大佬，我看懂了！比心心

评论 6

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

查看更多评论

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。