Python 爬虫爬取图片

gjl_

已于 2023-11-02 12:57:37 修改

阅读量754

点赞数 4

分类专栏： python 文章标签： python 爬虫开发语言

于 2023-11-02 11:34:37 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_51559599/article/details/134178678

版权

python 专栏收录该内容

19 篇文章 0 订阅

订阅专栏

爬取图片

源码

import requests
import re

# 图片格式 <img class="large" src="style/u24020836931378817798fm170s6BA8218A7B2128178FA0A49F010080E2w.jpg">

def html_code(url):
    # 发送 get 请求
    res = requests.get(url=url)
    # 将响应正文的二进制解码返回
    html = res.content.decode()
    return html

# 正则匹配,筛选图片地址，  注意 \w 无法匹配 “/”
def img_path_list(html):
    # 此处匹配 “style/” 和 “.jpg” 中间所有内容，点号要进行转义，返回 jpg 图片名列表
    return re.findall(r"style/\w*\.jpg",html)

def img_request(img_path_list):
    img_list = []
    for img_path in img_path_list:
        # 请求每一个图片，将响应存储到列表中返回
        img_list.append(requests.get(url+img_path))
    return img_list

def img_download(img,i):
    # 保存路径要精确到文件名，防止文件名重复覆盖，此处添加变量
    img_save_path = f"./image/{i}.jpg"
    # 注意 wb 以二进制形式读写
    print(img_save_path )
    with open(img_save_path,"wb") as f:
        f.write(img.content)

url = "http://10.9.47.154/python-spider/"
# 请求该网页的 html 代码
html=html_code(url)
# 获取文件名列表
img_path_list=img_path_list(html)
# 请求图片
imgs = img_request(img_path_list)
# 下载图片
i=0
for img in imgs:
    img_download(img,i)
    i+=1

效果

关注

4
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
Python 爬虫爬取图片

【代码】Python 爬虫爬取图片。
复制链接

扫一扫

专栏目录

gjl_ CSDN认证博客专家 CSDN认证企业博客

码龄4年

山东理工大学

172: 原创

104万+: 周排名

5万+: 总排名

7万+: 访问

: 等级

2356: 积分

545: 粉丝

601: 获赞

27: 评论

406: 收藏

私信

关注

热门文章

分类专栏

内网 6篇
apk、小程序渗透 1篇
常见漏洞 2篇
信息搜集 2篇
反序列化 3篇
SQL注入 15篇
文件上传 4篇
命令执行 2篇
爆破 1篇
SSRF 3篇
任意文件读取 4篇
文件包含 5篇
XSS 7篇
CSRF 4篇
漏洞复现 11篇
渗透测试 31篇
python 19篇
PHP 11篇
Apache、Tomact、Nginx 6篇
MySQL 数据库 5篇
Linux 24篇

最新评论

BurpSuite安装
箐箐子衿: 不需要配置环境变量吗？
SQL 注入——联合查询
「已注销」: 兄弟千锋来的吧，哈哈
Linux系统初识
CSDN-Ada助手: 恭喜你开始了博客创作的第一步！Linux系统初识是一个很好的主题，希望你可以继续分享你的学习和体验。下一步，你可以考虑深入探讨Linux系统的一些常见问题或者分享一些实用的技巧，这样可以更好地帮助读者理解和使用Linux系统。希望你能够继续保持谦虚的态度，不断学习和进步。加油！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1
Linux 基本命令练习
CSDN-Ada助手: 很棒的博文！练习Linux基本命令对于提高技能和效率都非常重要。希望你能继续分享更多关于Linux系统的知识和经验。另外，除了基本命令，你也可以深入了解一些高级命令和脚本编程，这些技能可以让你在Linux系统上更加得心应手。祝你学习进步！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
Linux 安装配置 Tomcat 服务，Tomcat 服务管理，Tomcat 攻防
简单简单小白: 讲解的很详细，很有参考价值

大家在看

YoloV8改进策略：Block篇|FFA-Net：用于单图像去雾的特征融合注意力网络（独家原创） 889

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

gjl_ 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。