盘点Python正则表达式中的贪婪模式和非贪婪模式

点击上方“Python共享之家”,进行关注

回复“资源”即可获赠Python学习资料

潮落夜江斜月里,两三星火是瓜洲。

大家好,我是我是皮皮。

一、前言

前几天在Python最强王者交流群有个叫【杰】的粉丝问了一个关于Python正则表达式的问题,其中涉及到Python正则表达式中的贪婪模式和非贪婪模式,讨论十分火热,这里拿出来给大家分享下,一起学习。

dd9c3cd71e35d7a50910b4aeceb21bdc.png

二、解决过程

这里分享【小王】大佬的解答,一起来看看吧,下面是他给的一个示例代码。

import re

txt = "This is an HTML tag: <head>HEADER</head>. It means the head of the whole HTML document."
pattern1 = re.compile(r"<.*>")
pattern2 = re.compile(r"<.*?>")
result1 = re.findall(pattern1, txt)
result2 = re.findall(pattern2, txt)
print(result1)
print(result2)

输出结果如下图所示:

d497a4ad8cadf616c994680c415b8ffe.png

关于输出的解析如下:

我想匹配HTML标签中的数据,也就是<>之间的数据。

pattern1 = re.compile(r"<.*>")
pattern2 = re.compile(r"<.*?>")

这两种只相差了一个?,但是区别却很大。解析如下图所示:

59e6b6c3cc4ffc434385667cde965f9e.png

直到什么时候停止呢?

3e3ac5c1403e5c4c1febc811c43c3194.png

这个就是贪婪模式的匹配方式,那么非贪婪模式呢?

6cbb1b5bbd2410bc2e8008c615f5de5d.png

小彩蛋

分享一个【小王】大佬的代码,实现的效果是将正则匹配结果写成命名分组Python代码。

常规写法如下所示:

import re

txt = "This is an HTML tag: <head>HEADER</head>. It means the head of the whole HTML document."

tag = re.compile(r"<([A-Za-z0-9]+)>.*?</\1>.*")
print(re.findall(tag, txt))

写成命名分组的写法如下所示:

txt = "This is an HTML tag: <head>HEADER</head>. It means the head of the whole HTML document."

tag = re.compile(r"<(?P<tag_mark>[A-Za-z0-9]+)>.*?</(?P=tag_mark)>.*")
print(re.findall(tag, txt))

总结

大家好,我是皮皮。这篇文章基于粉丝提问,针对Python正则表达式中的贪婪模式和非贪婪模式问题,给出了具体说明和演示,顺利的帮助粉丝解决了问题。

最后感谢粉丝【杰】提问,感谢【小王】大佬给出的解答和示例,感谢【🌑(这是月亮的背面)】、【dcpeng】、【wangning】、【Chloé P.】等大佬们参与学习交流。

小伙伴们,快快用实践一下吧!如果在学习过程中,有遇到任何问题,欢迎加我好友,我拉你进Python学习交流群共同探讨学习。

60845eb5b174dbfc8f9cb2b6800c3979.png

------------------- End -------------------

往期精彩文章推荐:

8fcf2015070ce4f8ebedab54958e32ee.png

欢迎大家点赞,留言,转发,转载,感谢大家的相伴与支持

想加入Python学习群请在后台回复【

万水千山总是情,点个【在看】行不行

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值