Python3正则表达式(三)贪婪模式与非贪婪模式

最新推荐文章于 2024-07-23 14:38:04 发布

坚强的狗蛋

最新推荐文章于 2024-07-23 14:38:04 发布

阅读量2.2w

点赞数 10

分类专栏： python3正则表达式文章标签：贪婪模式非贪婪模式正则表达式

本文链接：https://blog.csdn.net/m0_37852369/article/details/79101892

版权

python3正则表达式专栏收录该内容

3 篇文章 0 订阅

订阅专栏

在前面两篇文章当中已经介绍了python用正则表达式的基本运用，接下来总结一下正则表达式中的贪婪模式和非贪婪模式。

一、概念

首先举个例子：
example = "abbbbbbc" pattern = re.compile("ab+")
贪婪模式：正则表达式一般趋向于最大长度匹配，也就是所谓的贪婪匹配。如上面使用模式pattern 匹配字符串example，匹配到的结果就是”abbbbbb”整个字符串。

非贪婪模式：在整个表达式匹配成功的前提下，尽可能少的匹配。如上面使用模式pattern 匹配字符串example，匹配到的结果就只是”ab”整个字符串。

二、使用方法

在python中默认采用的是贪婪模式，使用非贪婪模式的话，只需要在量词后面直接加上一个问号”?”。
在第一篇文章中介绍了正则表达式当中的量词一共有五种：
这里写图片描述

三、原理分析

在正则表达式中一般默认采用的是贪婪模式，在上面的例子当中已经匹配到了“ab”时已经可以使整个表达式匹配成功，但是由于采用的是贪婪模式，所以还需要往后继续匹配，检查时候存在更长的可以匹配成功的字符串。一直到匹配到最后一个”b”的时候，后面已经没有可以成功匹配的字符串了，匹配结束。返回匹配结果“abbbbbb”。
所以，我们可以将贪婪模式理解为：在整个表达式匹配成功的前提下，尽可能多的匹配。

非贪婪模式也就是将我们例子中的正则表达式“ab+”改为”ab+?”，当匹配到“ab”时，已经匹配成功，直接结束匹配，不在向后继续尝试，返回匹配成功的字符串”ab”。
所以，我们可以将非贪婪模式理解为：在整个表达式匹配成功的前提下，尽可能少的匹配

四、实例

import re

example = "<div>test1</div><div>test2</div>"

greedPattern = re.compile("<div>.*</div>")
notGreedPattern = re.compile("<div>.*?</div>")

greedResult = greedPattern.search(example)
notGreedResult = notGreedPattern.search(example)

print("greedResult = %s" % greedResult.group())
print("notGreedResult = %s" % notGreedResult.group())