python爬取图片，初学者可以实践练手

珍珍珍香O_o

于 2023-03-30 20:01:33 发布

阅读量85

点赞数 1

文章标签： python 开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_74059969/article/details/129865394

版权

import  requests
import lxml.html
from lxml import etree
import os

#导入伪装头
headers={"伪装浏览器"}  #可以试着伪装自己，因为我爬取的比较小就没有使用上了


base_url=f"https://colorhub.me/photos?page=1"  #获取图片的链接地址，我这只爬取了一页图片
req=requests.get(base_url)   #发出请求

req.encoding="gbk"  
html=etree.HTML(req.text)  #将获取到的数据转成HTML文档的形式

hrefs=html.xpath("//*[@class='card photo-card']/a/@href")  #定位到每个图片的url地址

for i in hrefs:   #循环得到的图片链接，并获取其HTML数据
    pic_lode=requests.get(i)
    c=etree.HTML(pic_lode.text)

    pic_name=c.xpath("//*[@data-magnify='gallery']/@title")[0]  #定位到图片的名字

    pic_lode_place=c.xpath("//*[@data-magnify='gallery']/@href") #定位到图片的当前源信息

    for i in pic_lode_place:   #最后一步是循环信息，并写入文件中
        x="http:"+i
        requ=requests.get(x).content
        if not os.path.exists("python爬虫/爬虫图片"):
            os.mkdir("python爬虫/爬虫图片")
        img_path = "./爬虫图片/" + pic_name + '.jpg'
        with open(img_path, 'wb') as f:
            f.write(requ)
            print(pic_name+".jpg下载完成")
    print("全部下载完成")

珍珍珍香O_o

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python爬取图片，初学者可以实践练手

python爬取图片，步骤详细，小白练手
复制链接

扫一扫

珍珍珍香O_o CSDN认证博客专家 CSDN认证企业博客

码龄2年

4: 原创

170万+: 周排名

222万+: 总排名

628: 访问

: 等级

45: 积分

1: 粉丝

3: 获赞

2: 评论

0: 收藏

私信

关注

热门文章

分类专栏

c 1篇
python爬虫 1篇

最新评论

c的基础知识点复习
CSDN-Ada助手: 恭喜您写完了第四篇博客！标题为“c的基础知识点复习”真是不错的选择。不仅令人期待地复习了C语言的基础知识，还为读者提供了一个学习和巩固的机会。在接下来的创作中，或许您可以考虑加入一些具体的例子或案例，以帮助读者更好地理解和运用这些知识点。我相信您在这方面一定有许多独到的见解和经验，期待看到更多精彩的文章！加油！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
实战：利用redis存储url，并将爬取的数据写入mongoDB中
CSDN-Ada助手: 恭喜您写出了第三篇博客，分享了利用redis存储url和将爬取的数据写入mongoDB的实战经验，内容十分实用。接下来建议可以探讨如何优化爬取效率，或者分享其他实践经验，期待您的下一篇文章。 CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3，我们会奖励持续创作和学习的博主，请看：https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply3
自学python爬虫方法，对网络小说进行抓取！
CSDN-Ada助手: 推荐 Python入门技能树：https://edu.csdn.net/skill/python?utm_source=AI_act_python

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。