Python脚本--爬取网页图片

最新推荐文章于 2024-08-10 23:14:03 发布

奋斗的马喽

最新推荐文章于 2024-08-10 23:14:03 发布

阅读量374

点赞数 10

文章标签： python 开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_62202418/article/details/134627193

版权

本文介绍了如何使用Python的requests模块发送HTTPGET请求，解析网页内容以获取图片路径，然后下载并保存图片。涉及到了自定义请求头、正则表达式匹配和文件操作等技术。

摘要由CSDN通过智能技术生成

# 载入requests 模块,用来模拟浏览器行为，发送HTTP 请求，并处理HTTP 响应的功能。
import requests
# 载入re模块(能按某种模式匹配一系列有相似特征的字符串)
import re
# 载入time模块
import time

# 定义一个网址
url="http://10.1.1.167/python-spider/"
# 自定义请求头部(随便找一个)
headers= {
	"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/118.0.0.0 Safari/537.36"
}

# 1.定义一个获取网页源码的函数
def get_http_res_content(url):
    # 发送一个get请求,返回为二进制(content)
    res= requests.get(url= url, headers= headers)
    return res.content
# decode()将二进制进行转码
html= get_http_res_content(url).decode()
# print(html)


# 2.定义一个获取图片路径的函数
def get_img_path_list(html):
	# 将以style/ 开头且 .jpg结尾的筛选出来，findall返回一个列表
    img_path_list= re.findall(r"style/\w*\.jpg", html)
    return img_path_list
img_path_list= get_img_path_list(html)

# 对图片的路径进行遍历(遍历一次，下载一次)
for img_path in img_path_list:
	# print(img_path)
    # 将网址和图片地址进行拼接，拼接成完整地址
    img_url= url+ img_path
    # 获取图片内容
    img= get_http_res_content(img_url)
    # print(img)
    # 定义图片存储路径，time.time()当前时间
    img_save= f"./images/{time.time()}.jpg"
    # 以写入、二进制的形式打开文件
    with open(img_save,"wb") as f:
        f.write(img)

奋斗的马喽

关注

10
点赞
踩
8

收藏

觉得还不错? 一键收藏
1
评论
Python脚本--爬取网页图片

【代码】Python脚本--爬取网页图片。
复制链接

扫一扫

奋斗的马喽 CSDN认证博客专家 CSDN认证企业博客

码龄3年

31: 原创

123万+: 周排名

22万+: 总排名

1万+: 访问

: 等级

650: 积分

250: 粉丝

330: 获赞

6: 评论

327: 收藏

私信

关注

热门文章

最新评论

Python脚本--猜数字游戏
CSDN-Ada助手: 亲爱的作者，恭喜您写了第15篇博客！看到您分享了关于Python脚本的猜数字游戏，我感到非常兴奋。您的博客内容总是让我受益匪浅，真的很感谢您的辛勤付出。在未来的创作中，我希望您能继续分享关于Python脚本的实用技巧和应用案例，或者探讨一些新颖的编程思路。我相信您的经验和见解一定能给读者带来更多的启发和帮助。期待您的下一篇博客，谢谢您的分享！
Python脚本--随机密码生成器
CSDN-Ada助手: 恭喜你写了第16篇博客！Python脚本--随机密码生成器看起来很有趣，我期待能够尝试一下。不过，我想提个小建议，下一步可以尝试添加一些实用功能，比如密码强度评估或者保存生成的密码到文件中。希望我的建议能对你有所帮助，期待你更多的创作！
Python脚本--shadow密码爆破
CSDN-Ada助手: 恭喜您写了这么精彩的一篇博客！对Python脚本和密码爆破的内容进行了深入的探讨，让人受益匪浅。希望您能继续保持创作的热情，分享更多有价值的内容给大家。或许在下一篇博客中，可以探讨一下Python脚本在网络安全领域的应用，或者分享一些实战经验和技巧。期待您更多的精彩作品！
Python脚本--内网主机存活检测程序
CSDN-Ada助手: 恭喜作者发布了第18篇博客，标题为“Python脚本--内网主机存活检测程序”。这篇博客内容十分实用，对于网络安全和管理工作有着重要的帮助。希望作者能够继续保持创作的热情和积极性，不断分享自己的经验和技术。同时，建议作者在下一篇博客中可以结合实际案例，分享一些在使用该程序过程中遇到的问题和解决方法，这样能够更好地帮助读者理解和应用。期待作者的更多精彩内容，加油！
Python脚本--爬取网页图片
CSDN-Ada助手: 恭喜你写了第19篇博客！学习了你的Python脚本爬取网页图片的方法后，我对这方面的知识有了更深入的了解。希望你能继续分享更多关于Python脚本的教程，也可以考虑分享一些实际项目中的应用案例，这样可以让读者更好地理解并应用所学知识。期待你的下一篇作品！

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。