Python练手小程序—用正则表达提取html中的url

最新推荐文章于 2024-07-18 09:52:46 发布

hanfeixue2001

最新推荐文章于 2024-07-18 09:52:46 发布

阅读量1k

点赞数 1

分类专栏： python练手小程序文章标签： python 正则表达式

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hanfeixue2001/article/details/103736837

版权

本文是一名Python初学者在GitHub上找到的练手项目，旨在通过正则表达式从HTML源码中提取`href="url"`的链接。作者分享了简单的Python代码，并计划后续深入探讨Python正则表达式。

摘要由CSDN通过智能技术生成

在GitHub上发现一些很有意思的项目，由于本人作为Python的初学者，编程代码能力相对薄弱，为了加强Python的学习，特此利用前辈们的学习知识成果，自己去亲自实现。

来源：GitHub
Python练手小程序项目地址：https://github.com/Show-Me-the-Code/python
写作日期：2019.12.27

今天练习第0009题，题目如下：
在这里插入图片描述
先看一下HTML这个页面和源码吧

很简单，和上次提取HTML文件正文类似，这次还是用正则表达式提取URL，规则写的比较粗糙，主要提取href="url"中的，更多不符合条件的就没怎么提取，但也包含HTML文件的很多了!

下次准备专门针对Python的正则表达式写一篇文章，主要涉及一些用法，学会熟练运用！

Python代码如下：

import re
import codecs


def

最低0.47元/天解锁文章

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。