python 抓取图库图片

最新推荐文章于 2024-02-13 22:12:56 发布

**快乐的乐天派**

最新推荐文章于 2024-02-13 22:12:56 发布

阅读量358

点赞数

文章标签： python 开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xyt1231/article/details/128028473

版权

# 1.requests 发送请求，从服务器获取到数据。

# 2.BeautifulSoup 来解析整个页面的源代码

import requests

from bs4 import BeautifulSoup

# 爬取网站的第一件事发送请求到服务器

url = "http://www.umei.cc/meinvtupian/meinvxiezhen/" #网页地址

resp = request.get(url) # 从服务器拿到源码

resp.encoding = "utf-8"

# 解析html

page = BeautifulSoup(resp.text, "html.parser")

# 从页面中找到某些东西

# find() 找一个

# find_all() 找所有

typeList = page.find("div", attrs={"class":"TypeList"}) #找到属名为TypeList的div里的所有内容

alist = typeList.find_all("a", attrs= {"class":"TypeBigPics"}) #找到属性名为TypeBigPics的所有a标签

for a in alist:

href = a.get("href") # 获取子页面的链接

resp1 = requests.get(href) # 给子页面发送请求

resp1.encoding = "utf-8"

child_page = BeautifulSoup(respl.text, "html.parse")

#找到图片的真实路径

src = child_page.find("div", attrs={"class":"ImageBody"}).find("img").get("src")

# 发送请求到服务器，把图片保存在本地

# 创建文件

f = open(""tu_%s.jpg %n, mode = "wb") # wb表示写入的内容是非文本文件

f.write(requests.get(src).content )# 向外拿出图片的数据_不是文本信息

print("恭喜你，下载了一张图片")

n+=1

# 如果是一组图片的时候

text = child_page.find("div", attrs = {"class": "ImageBody"}).find_next("script").text

#拿到script里面的文本

num = text.split(",")[1].strip("\"") #去除引号

网站架构不一样，方法会有所区别，但是思路是差不多的。

**快乐的乐天派**

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
python 抓取图库图片

python 爬虫爬取图库图片
复制链接

扫一扫

**快乐的乐天派** CSDN认证博客专家 CSDN认证企业博客

码龄3年

4: 原创

164万+: 周排名

64万+: 总排名

4153: 访问

: 等级

42: 积分

1: 粉丝

2: 获赞

3: 评论

7: 收藏

私信

关注

热门文章

最新评论

Word向下箭头怎样去掉
CSDN-Ada助手: 恭喜您写出了第四篇博客，标题也很有吸引力。感谢您分享如何去掉Word中的向下箭头，这对于我们学习和使用Word来说非常实用。接下来，建议您可以继续分享一些Word的高级应用，比如如何制作专业的文档格式、如何利用Word进行数据分析等等。期待您的更多优质内容，加油！ CSDN 会根据你创作的前四篇博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply4 看奖励名单。
电脑基本操作-电脑分屏快捷键
CSDN-Ada助手: 恭喜您写了这么有用的博客！电脑分屏快捷键确实是很实用的技巧。接下来，我建议您可以写一些电脑常见故障的解决方法，这对于不太懂电脑的人来说也是非常有帮助的。期待您的下一篇博客！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3，我们会奖励持续创作和学习的博主，请看：https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply3
python 抓取图库图片
CSDN-Ada助手: 推荐 Python入门技能树：https://edu.csdn.net/skill/python?utm_source=AI_act_python

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。