Python爬取网页图片01

最新推荐文章于 2023-06-15 00:00:00 发布

闫文敬

最新推荐文章于 2023-06-15 00:00:00 发布

阅读量1.4k

点赞数

分类专栏： python 文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u011106915/article/details/78313488

版权

python 专栏收录该内容

12 篇文章 0 订阅

订阅专栏

# !/usr/bin/python
# -*- coding: UTF-8 -*-
import re
import urllib


# 获取网页信息
def getHtml(url):
    page = urllib.urlopen(url)
    html = page.read()
    print html
    return html


def getImg(html):
    # 匹配网页中的图片
    reg = r'src="(.*?\.jpg)" alt'
    imgre = re.compile(reg)
    imglist = re.findall(imgre, html)
    x = 0
    for imgurl in imglist:
        print imgurl
        urllib.urlretrieve(imgurl, '%s.jpg' % x)
        x += 1


# html2 = getHtml("https://tieba.baidu.com/p/3901139917")
html3 = getHtml("http://photo.bitauto.com/?WT.mc_id=360tpdq")
print getImg(html3)

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Python爬取网页图片01

# !/usr/bin/python# -*- coding: UTF-8 -*-import reimport urllib# 获取网页信息def getHtml(url): page = urllib.urlopen(url) html = page.read() print html return htmldef getImg(html):
复制链接

扫一扫

专栏目录

闫文敬 CSDN认证博客专家 CSDN认证企业博客

码龄11年

236: 原创

2万+: 周排名

1万+: 总排名

61万+: 访问

: 等级

6100: 积分

1775: 粉丝

294: 获赞

99: 评论

535: 收藏

私信

关注

热门文章

分类专栏

flutter 7篇
kotlin 11篇
异常日志 6篇
Android 1篇
Android测试 4篇
性能优化 3篇
Android知识点 60篇
Android控件 20篇
Android进阶 13篇
Android打包 14篇
Android持续化集成 3篇
Android模块化 2篇
ndk 3篇
gradle 7篇
Android异常 2篇
web前端开发 4篇
js 1篇
信息系统项目管理
git 2篇
Java 9篇
设计模式 34篇
python 12篇
命令行 8篇
服务搭建 7篇
php 3篇
笔记 3篇
日常杂谈 6篇

最新评论

关于Android gradle 7.0+版本的配置升级
遥不可及zzz: 第二部分，哪部分是使用classpath ,那部分是在plugins 内 id '三方配置'？
java身份证号码正则表达式校验（含最后一位的校验值规则）
闫文敬: 这里的格式检查，并不能检测是否是一个真正身份证号码
java身份证号码正则表达式校验（含最后一位的校验值规则）
橘子00汽水: 我使用了，官方不合法的还是正确喔，440823199407281000
Android APP极光推送取消关联启动配置
闫文敬: 用jadx看一下这个发送广播代码附近的逻辑，然后自己手动去控制该怎么去关闭，如果控制不了，那真的没办法了，就是这么让人
Android APP极光推送取消关联启动配置
qq_31377529: 怎么取消自启动呢，这个也没用，app在退出时极光还是有发送这个广播cn.jpush.android.service.PushReceiver action=android.intent.action.PACKAGE_ADDED

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。