python 正则非贪婪

wipenHan

于 2024-07-25 03:44:38 发布

阅读量25

点赞数

文章标签： python 开发语言

python相关学习资料：

https://edu.51cto.com/video/1158.html

https://edu.51cto.com/video/4102.html

https://edu.51cto.com/video/4645.html

Python 正则表达式中的非贪婪模式

正则表达式是一种强大的文本匹配工具，广泛应用于各种编程语言中，Python 也不例外。在 Python 中，我们可以使用内置的 re 模块来处理正则表达式。在本篇文章中，我们将探讨正则表达式中的非贪婪模式，并通过一些代码示例来展示其用法。

正则表达式简介

正则表达式是一种用于匹配字符串中字符组合的模式。它由一系列字符和特殊符号组成，这些符号定义了匹配规则。例如，\d 表示匹配任意数字，\w 表示匹配任意字母数字字符，\s 表示匹配任意空白字符。

贪婪模式与非贪婪模式

在正则表达式中，有两种匹配模式：贪婪模式和非贪婪模式。默认情况下，正则表达式使用贪婪模式，它会尽可能多地匹配字符。而非贪婪模式则相反，它会尽可能少地匹配字符。

贪婪模式

贪婪模式下，正则表达式会尽可能多地匹配字符。例如，考虑以下正则表达式：

这段代码会输出 ['123456789']，因为 \d+ 匹配了尽可能多的数字字符。

非贪婪模式

非贪婪模式下，正则表达式会尽可能少地匹配字符。要启用非贪婪模式，只需在量词（如 +、*、?）后面加上一个问号 ?。例如：

这段代码会输出 ['123', '4567', '89']，因为 \d+? 匹配了尽可能少的数字字符。

代码示例

让我们通过一些示例来更好地理解非贪婪模式。

示例 1：匹配数字

假设我们有一段文本，其中包含多个数字，我们希望匹配这些数字，但每个数字之间用空格分隔。

输出结果为 ['123', '4567', '89']。

示例 2：匹配 HTML 标签

假设我们有一个 HTML 文档，我们希望匹配所有的标签，但不包括标签内的文本。

import re

html = "<html><head><title>Example</title></head><body><p>Hello, world!</p></body></html>"
pattern = r'<.*?>?'
matches = re.findall(pattern, html)
print(matches)

输出结果为 ['<html>', '<head>', '<title>', '</title>', '<body>', '<p>', '</p>', '</body>', '</html>']。

示例 3：匹配重复字符

假设我们有一个字符串，我们希望匹配重复的字符，但每个字符只匹配一次。

输出结果为 ['a', 'b', 'c']。

序列图

为了更好地理解非贪婪模式的工作原理，我们可以使用序列图来展示匹配过程。以下是示例 1 的匹配过程：

结论

非贪婪模式是一种有用的正则表达式匹配模式，它可以帮助我们更精确地匹配文本。通过在量词后面添加问号 ?，我们可以控制匹配的字符数量，从而实现更灵活的文本处理。希望本文的示例和解释能帮助你更好地理解和使用非贪婪模式。

原创作者: u_16213393 转载于: https://blog.51cto.com/u_16213393/11554749

wipenHan

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python 正则非贪婪

python相关学习资料：https://edu.51cto.com/video/1158.htmlhttps://edu.51cto.com/video/4102.htmlhttps://edu.51cto.com/video/4645.htmlPython 正则表达式中的非贪婪模式正则表达式是一种强大的文本匹配...
复制链接

扫一扫