简单爬虫源码，下载指定网页所有图片

最新推荐文章于 2024-05-02 04:50:36 发布

羽二

最新推荐文章于 2024-05-02 04:50:36 发布

阅读量1.2k

点赞数 1

分类专栏：爬虫

本文链接：https://blog.csdn.net/qq_34963461/article/details/52838615

版权

以下是源码，参考的是虫师写的简单爬虫的实现，虫师教程太老，导致范例跑不起来。原因是里面的网址404了。必须要正则能够搜索到图片。

本文范例所用网址里面的图片命名是 http://tb.himg.baidu.com/sys/portrait/item/33a5786c3936343937303734355a33

#-*- coding:utf-8 -*-
import re
import urllib


def getHtml(url):
    page = urllib.urlopen(url)
    html = page.read()
    return html

def getImg(html):
    reg = r'src="(http://.*?)"'
    imgre = re.compile(reg)

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

羽二

关注关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
简单爬虫源码，下载指定网页所有图片

以下是源码，参考的是虫师写的简单爬虫的实现，虫师教程太老，导致范例跑不起来。原因是里面的网址404了。必须要正则能够搜索到图片。本文范例所用网址里面的图片命名是 http://tb.himg.baidu.com/sys/portrait/item/33a5786c3936343937303734355a33#-*- coding:utf-8 -*-import reimpo
复制链接

扫一扫