爬取壁纸图片

最新推荐文章于 2025-04-30 11:36:10 发布

한경전

最新推荐文章于 2025-04-30 11:36:10 发布

阅读量440

点赞数 11

文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/helloMrHan/article/details/136171124

版权

# 解析下载图片数据
# 网址： https://pic.netbian.com/4kmeinv/

import requests
from lxml import etree
import os

if not os.path.exists('./meinvImage'):
    os.mkdir('./meinvImage')
headers = {
    'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.90 Safari/537.36'
}
url = 'https://pic.netbian.com/4kmeinv/index_%d.html'
for pageNum in range(2, 174):
    new_url = format(url%pageNum)
    image = requests.get(url=new_url, headers=headers)
    # 收到设置响应编码格式
    # image.encoding= 'utf-8'
    text = image.text
    # print(image)
    tree = etree.HTML(text) # 实例化

    tupian = tree.xpath('//ul[@class="clearfix"]/li')
    # print(tupian)

    for tupian01 in tupian:
        a = tupian01.xpath('./a/img/@src')[0]
        # print(a)
        b = 'https://pic.netbian.com/' + a
        c = tupian01.xpath('./a/img/@alt')[0] + '.jpg'
        # 通用处理中文乱码的解决方案
        c = c.encode('iso-8859-1').decode('gbk')
    # 请求图片进行持久化存储
        data = requests.get(url=b, headers=headers).content
        image_path = 'meinvImage/' + c
        with open(image_path, 'wb') as fp:
            fp.write(data)
            print('下载成功！！！')
``

博客等级

码龄6年

4
原创

38
点赞

31
收藏

36
粉丝

关注

私信

热门文章

分类专栏

python技术 1篇

最新评论

解决上传文件格式问题
CSDN-Ada助手: 太棒了！看到你发表了第二篇博客，真是令人振奋！继续努力创作，分享你的技术经验和解决问题的方法，一定会受益匪浅的。除了解决上传文件格式问题，你还可以深入了解文件处理的相关知识，比如文件的类型、大小限制、安全性等方面。另外，你也可以探索一些文件处理的开源库或工具，比如Apache Commons FileUpload、jQuery File Upload等，这些工具可以帮助你更高效地处理文件上传和格式问题。期待看到你更多的分享，继续加油！🚀👏 如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
爬取壁纸图片
CSDN-Ada助手: 非常感谢你的分享，能够学习到如何爬取壁纸图片的技巧。希望你能继续保持创作的热情，分享更多有趣的内容。下一步，我建议你可以尝试分享一些壁纸图片的美化处理技巧，或者介绍一些优秀的壁纸图片网站，让读者能够更好地欣赏和利用这些图片。期待你的更多精彩内容！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
服务器上不挂断启动Django项目
CSDN-Ada助手: 恭喜你更新了第四篇博客！看来你对服务器上不挂断启动Django项目有了更深入的理解。不过我觉得下一步你可以尝试分享一些关于Django项目优化或者与其他技术的整合方面的经验，这样可以让读者获益更多。希望你能继续保持创作的热情，期待你更多精彩的分享！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。