贪婪模式和非贪婪模式
正则表达式默认为贪婪匹配,也就是尽可能多的向后匹配字符,比如 {n,m} 表示匹配前面的内容出现 n 到 m 次(n 小于 m),在贪婪模式下,首先以匹配 m 次为目标,而在非贪婪模式是尽可能少的向后匹配内容,也就是说匹配 n 次即可。
贪婪模式转换为非贪婪模式的方法很简单,在元字符后添加“?”即可实现,如下所示:
贪婪模式 | 非贪婪模式 |
---|---|
* | *? |
+ | +? |
? | ?? |
{n,m} | {n,m}? |
例子
1.贪婪模式
在第一次匹配成功之后还会继续匹配,尽可能的多匹配
2.非贪婪模式
在第一次匹配之后就结束匹配,尽可能的少匹配
对于字符串“abbbbb”,"ab+"的匹配结果为"abbbbb","ab+?"的匹配结果为"ab"。
import re
example = "<div>test1</div><div>test2</div>" #为需要处理的字符串
greedPattern = re.compile("<div>.*</div>") #贪心处理
notGreedPattern = re.compile("<div>.*?</div>") #非贪心处理
greedResult = greedPattern.search(example)
notGreedResult = notGreedPattern.search(example)
print("greedResult = %s" % greedResult.group())
print("notGreedResult = %s" % notGreedResult.group())
运行结果(本代码是用python写的)
在学习的过程中遇到了一个不太会的正则表达式
str.replace(/(\d)(?=(?:\d{
3
})+$)/g,
'$1,'
)
这个是在js中的一段代码,其主要作用是没三个数就增加一个逗号,例如123456,变为123,456
接下来就让我来介绍一下这段代码的具体含义,加了括号其实就是捕获组(什么是捕获组这里就不进一步讲解了,捕获组是以左括号为辨识的,而加了?:这就表示为这个为非捕获组,意味着能被匹配但是不会进行分组),而?=的具体含义就是
前瞻匹配,exp1(?=exp2) 查找exp2前面的exp1。先来一个例子
// 随便打了一串字符串
let str = '123sertersdTYgfgbh45t6343Dfdgbgdfher345#$%FTGH4t';
// 查找大小写字母前面的3-5位的数字并替换为 -
let res = str.replace(/\d{3,5}(?=[a-zA-Z])/g, '-');
console.log(str);
console.log(res);
123sertersdTYgfgbh45t6343Dfdgbgdfher345#$%FTGH4t34dfg34t56G8rtuy56fgbT6dfy58845er
-sertersdTYgfgbh45t6343Dfdgbgdfher345#$%FTGH4t34dfg34t56G8rtuy56fgbT6dfy58845er
这个的具体含义,在满足?=后边规则的情况下,查找之前的满足条件的数字
封面图源来自网络(某一韩国小哥)