python爬取优美图库海量图片，附加代码，一键爬取

码上游

于 2022-02-04 10:57:16 发布

阅读量2.1k

点赞数

文章标签： python pycharm 开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/pakerder/article/details/122781649

版权

优美高清图片为大家提供高清美女套图赏析,非高清不录入,大家的网速要给力。

今天教大家爬取优美图库网站中高质量的图片！！

效果如下：

使用工具：

Python 3.9

pycharm

主要内容：

1、系统分析目标网页

2、海量图片数据一键保存文件夹

爬虫的一般思路：

1.拿到主页面的源代码，提取子页面的链接地址，href
2.通过href拿到子页面的内容，从子页面中找到图片的下载地址 img->src
3.下载图片

代码：

#1.拿到主页面的源代码，提取子页面的链接地址，href
#2.通过href拿到子页面的内容，从子页面中找到图片的下载地址 img->src
#3.下载图片
import requests
from bs4 import BeautifulSoup
import time
url = "https://umei.cc/bizhitupian/meinvbizhi/"
url2 = "https://umei.cc/"
resp = requests.get(url)
resp.encoding = 'utf-8'
#将源代码交给bs
#print(resp.text)
page = BeautifulSoup(resp.text,"html.parser")
alist = page.find("div","TypeList").find_all("a")
#print(alist)
for a in alist:
    #print(url2+a.get('href')) #直接通过get就可以拿到属性的值
    #拿到子页面的源代码
    href = url2+a.get('href')
    child_page_resp = requests.get(href)
    child_page_resp.encoding = 'utf-8'
    child_page_text = child_page_resp.text
    #从子页面拿到图片下载路径
    child_page = BeautifulSoup(child_page_text,"html.parser")
    im = child_page.find("div","ImageBody")
    img = im.find("img")
    #print(img.get("src"))
    src = img.get("src")
    #下载图片
    img_resp = requests.get(src)
    #img_resp.content #这里拿到的是字节
    img_name = src.split("/")[-1] #拿到url中最后一个/后的内容
    with open("img/"+img_name,mode="wb") as f:
        f.write(img_resp.content) #图片内容写入到文件
    print("over!!!",img_name)
    time.sleep(1)
print("all over!!!")

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
1
评论
python爬取优美图库海量图片，附加代码，一键爬取

优美高清图片为大家提供高清美女套图赏析,非高清不录入,大家的网速要给力。今天教大家爬取优美图库网站中高质量的图片！！效果如下：使用工具：Python 3.9pycharm主要内容：1、系统分析目标网页2、海量图片数据一键保存文件夹爬虫的一般思路：1.拿到主页面的源代码，提取子页面的链接地址，href2.通过href拿到子页面的内容，从子页面中找到图片的下载地址 img->src3.下载图片代码：#1.拿到主页面的源代码，提取子页面的链接
复制链接

扫一扫

码上游 CSDN认证博客专家 CSDN认证企业博客

码龄3年

152: 原创

2万+: 周排名

128万+: 总排名

23万+: 访问

: 等级

1882: 积分

2406: 粉丝

232: 获赞

46: 评论

743: 收藏

私信

关注

热门文章

分类专栏

最新评论

【详细解析】【PTA】7-12 连续因子 (20 分)
remnant_song: 有两个点过不去，博主没有考虑质数
计算机组成原理知识点【第三天】-补码移码
做而论道_CS: 所谓的移码，只是一个 “障眼法” 而已。补码，是代表正负数字的。学过计算机基础的，都知道补码的真值是什么！为了不让别人看懂，可以采用各种加密的方法。这也就是 “障眼法” 了。移码＝补码＋偏移量，就是最简单的加密方法。补码＝移码－偏移量，就是解密。偏移量，在不同的场合，有不同的值。在余三码中，偏移量＝3。在 ASCII 码中，偏移量＝48。教材中的移码，偏移量＝128。而在 IEEE754 中，偏移量＝127、32767。。。。在你独立控制的范围内，偏移量，你就可以自己设计。与别人不兼容，就可以避免被人破译。
只有迷信的人，没有迷信的知识
NLP还是CV？: 道家和佛家的看了一些书，天涯社区看了中国人写的经济历史分析，觉得比我看一年多的西方的东西收获的多的多
【诺贝尔物理奖量子纠缠】启发：命由我作，福由我求
NLP还是CV？: 身边有些我很佩服的人，也懂一点玄学。前两年我被找回到老家，遇到我基本从小没见的爷爷。算的也是比较准
【诺贝尔物理奖量子纠缠】启发：命由我作，福由我求
NLP还是CV？: 我错了，我发现我那年被西方的哲学骗了，后来接触的事情多了，知识也增加了，就想法变了

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

码上游 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。