python3爬虫（一）爬取网页全部图片

最新推荐文章于 2024-07-24 16:36:32 发布

Cloudia8020

最新推荐文章于 2024-07-24 16:36:32 发布

阅读量7.9k

点赞数 1

分类专栏：爬虫文章标签：爬虫全部图片爬取png

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Amy8020/article/details/88844309

版权

本文介绍了如何使用Python3爬虫从指定网页抓取所有的PNG图片。通过交互式输入网址，或者使用默认网址（http://findicons.com/pack/2787/beautiful_flat_icons），爬虫利用正则表达式匹配图片链接并将其保存到本地。

摘要由CSDN通过智能技术生成

命题

交互式输入网址，爬取网页中全部png图片。
若想爬取其他图片，只改动正则表达式即可

思路

读取网页中源码
根据网页源码制定正则表达式，进行匹配
存取图片至本地
交互模式输入网址，若不输入则按默认网址爬取(http://findicons.com/pack/2787/beautiful_flat_icons)

知识点

根据源码编写正则表达式：reg=r’src="(.+?.png)" alt’
为提升速度，进行编译匹配
imgre=re.compile(reg)
imglist=imgre.findall(html)

源码

import urllib.request
import re
import os
import urllib
#打开网页,读取源码
def getHtml(url):
    page=urllib.request

最低0.47元/天解锁文章

关注

1
点赞
踩
14

收藏

觉得还不错? 一键收藏
2
评论
python3爬虫（一）爬取网页全部图片

命题交互式输入网址，爬取网页中全部图片思路读取网页中源码根据网页源码制定正则表达式，进行匹配存取图片至本地交互模式输入网址，若不输入则按默认网址爬取(http://findicons.com/pack/2787/beautiful_flat_icons)知识点根据源码编写正则表达式：reg=r’src="(.+?.png)" alt’为提升速度，进行编译匹配imgre=...
复制链接

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。