Python练手小程序—用正则表达提取html中的url

本文是一名Python初学者在GitHub上找到的练手项目,旨在通过正则表达式从HTML源码中提取`href="url"`的链接。作者分享了简单的Python代码,并计划后续深入探讨Python正则表达式。
摘要由CSDN通过智能技术生成

在GitHub上发现一些很有意思的项目,由于本人作为Python的初学者,编程代码能力相对薄弱,为了加强Python的学习,特此利用前辈们的学习知识成果,自己去亲自实现。

来源:GitHub
Python练手小程序项目地址:https://github.com/Show-Me-the-Code/python
写作日期:2019.12.27

今天练习第0009题,题目如下:
在这里插入图片描述
先看一下HTML这个页面和源码吧
在这里插入图片描述
很简单,和上次提取HTML文件正文类似,这次还是用正则表达式提取URL,规则写的比较粗糙,主要提取href="url"中的,更多不符合条件的就没怎么提取,但也包含HTML文件的很多了!

下次准备专门针对Python的正则表达式写一篇文章,主要涉及一些用法,学会熟练运用!

Python代码如下:

import re
import codecs


def 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值