【PYTHON】正则匹配的贪婪模式和懒惰模式

在PYTHON使用正正则表达式匹配爬虫爬取下来的内容时经常使用两种模式:贪婪模式、懒惰模式

贪婪模式需要尽可能多的去匹配内容,其常用的表达式:.*【.表示识别任意除了\n外的字符,*表示识别0~n次;这里可以理解为 匹配0~n个 .

懒惰模式(非贪婪模式)则需要精准匹配尽可能少的内容,其常用的表达式为:.*?【?表示识别0次或1次;可以理解为 匹配0~n个 . 但只匹配第一次符合规格的内容

import re
str = '<button class="feedback-btn" style="display: inline-block;">'
pat1 = 'class=".*"'    #贪婪模式,尽可能多的匹配
pat2 = 'class=".*?"'   #懒惰模式,尽可能少的匹配

print("识别1",re.search(pat1, str))
#识别第一个“到最后一个”
print("识别2",re.search(pat2, str))
#识别第一个“到第二个”

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值