正则表达式贪婪匹配和惰性匹配分组和去优先级

最新推荐文章于 2022-01-20 17:02:38 发布

tsing_9521

最新推荐文章于 2022-01-20 17:02:38 发布

阅读量587

点赞数 1

分类专栏： python 入门正则表达式 python爬虫贪婪匹配惰性匹配正则表达式分组正则表达式去优先级文章标签： python 正则表达式 python爬虫贪婪匹配惰性匹配

本文链接：https://blog.csdn.net/weixin_44595372/article/details/87084586

版权

python 入门同时被 3 个专栏收录

40 篇文章 0 订阅

订阅专栏

python爬虫

6 篇文章 0 订阅

订阅专栏

正则表达式

5 篇文章 0 订阅

订阅专栏

最近在学爬虫，用到正则的贪婪匹配和惰性匹配，findall方法分组优先匹配和去优先级，
举几个例子感受一下：

import re
#不分组，无优先级
print(re.findall('m.+?','ascxdcmmmmmdabnxamnx')) #惰性匹配，+匹配到一个即匹配成功
输出：['mm', 'mm', 'md', 'mn']

print(re.findall('m*?','ascxdcmmmmmdabnxamnx'))
输出：['', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', ''] #惰性匹配，*匹配到0个即匹配成功

#分组，有优先级，优先匹配分组里的内容
print(re.findall('m(.*?)x','ascxdcmmmmmdabnxamnx')) #优先匹配分组里的内容,尽可能少的匹配
['mmmmdabn', 'n']

print(re.findall('m(.*)x','ascxdcmmmmmdabnxamnx')) #优先匹配分组里的内容，尽可能多的匹配
输出：['mmmmdabnxamn']

print(re.findall('m(.*?)','ascxdcmmmmmdabnxamnx')) #优先匹配分组里的内容，匹配到0个即匹配成功
输出：['', '', '', '', '', '']

print(re.findall('m(?:.*?)','ascxdcmmmmmdabnxamnx')) #去优先级，惰性匹配，匹配到0个即匹配成功
输出：['m', 'm', 'm', 'm', 'm', 'm']

tsing_9521

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
正则表达式贪婪匹配和惰性匹配分组和去优先级

最近在学爬虫，用到正则的贪婪匹配和惰性匹配，findall方法分组优先匹配和去优先级，举几个例子感受一下：import re#不分组，无优先级print(re.findall('m.+?','ascxdcmmmmmdabnxamnx')) #惰性匹配，+匹配到一个即匹配成功输出：['mm', 'mm', 'md', 'mn']print(re.findall('m*?','ascxd...
复制链接

扫一扫