python下载图片怎么保存_Python抓取站酷作品图片并保存至本地

最新推荐文章于 2024-03-11 15:19:12 发布

weixin_39998273

最新推荐文章于 2024-03-11 15:19:12 发布

阅读量1.4k

点赞数

文章标签： python下载图片怎么保存

本文介绍如何使用Python的requests和BeautifulSoup库抓取站酷网站上的作品图片，通过多线程下载并保存至本地。首先获取作品集URL，然后解析图片URL，最后保存图片。

摘要由CSDN通过智能技术生成

思路

1、通过 requests 模块请求网页，获取到网页的源码，其中包含了作品集的 URL

2、通过 BeautifulSoup 提取到作品集的 URL ，返回为列表，使用 for 循环遍历作品集

3、遍历访问作品集时，通过 BeautifulSoup 提取到图片的 URL，进行名称格式化后，返回

4、保存图片的 URL 至本地磁盘

5、遍历多页作品集，使用多线程

嗯。。。思路大概是这个样子吧，新手入门- -

模块编写

1、抓取主页（start_app）

100

从网页源码中可以看出，其主要内容包含在class为 work-list-box 的这个div内，并且每个作品又是单独包含在 class为 card-box这个div内的，所以首先，通过 BeautifulSoup 生成 soup 对象后，使用 soup.find class=work-list-box 找到位于该 class 内的元素，再通过 find_all class= card-box 生成作品集的一个列表，代码为：

def start_app(self):

print('[Message]正在抓取 - %s' % self.url)

try:

response = requests.get(self.url, headers=self.headers)

if response.status_code == 200:

soup = BeautifulSoup(response.text, 'lxml')

page_content = soup.find('div', class_="work-list-box")

card_box_list = page_content.find_all('div', class_="card-box")

else:

print('[Error]文档获取失败，状态为 - %s' % (self.url, response.status_code))

except Exception as e:

print(e)

2、抓取内容

1 中获取到的作品集list，在该模块进行遍历，通过 BeautifulSoup 方法获取到作品集的 URL，标题，作者，其中，标题 + 作者作为保存图片文件的路径，作品集的URL通过 requests 模块请求，再次抓取作品集内部的图片

100

def get_content(self, item):

title = item.find('a', class_="title-content")

avatar = item.find('div', class_="card-item")

if title is no

最低0.47元/天解锁文章

weixin_39998273

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。