【学习笔记】Python中的正则表达式re

暂做笔记,正在建设,请勿参考~

匹配方法

1.search()
只会返回一次匹配结果
2.match()
从头开始匹配,一点不符合立马结束匹配
3.全局匹配
re.compile(str).findall(html)
主要用法,可匹配所有结果。

匹配的结果

正则匹配的结果就是用原子匹配出的结果,3个(.*?)匹配出的就是3个部分的内容。i[2]就是第三部分的内容

#url = '<a title="如何用Python写一个计算器软件 附带效果图" href="https://www.thinksaas.cn/group/topic/834771/">如何用Python写一个计算器软件 附带效果图</a>'

str = '<a title="(.*?)" href="(.*?)">(.*?)</a>'
result = re.compile(str).findall(html)
for i in result:
    print(i[2])

贪婪与懒惰 (.*.*?

(明明是这么有用的东西,为什么名字都这么消极,我看应该叫积极和稳重-_-!)
例如 .* 这样的匹配,会匹配到所有的内容
?是懒惰的代名词, .*?可以保证 .*只匹配0次和1次。所以只会匹配到一次

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值