python作品_Python爬取dribbble网站作品

最新推荐文章于 2024-07-25 17:47:01 发布

weixin_39624864

最新推荐文章于 2024-07-25 17:47:01 发布

阅读量278

点赞数

文章标签： python作品

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39624864/article/details/111294849

版权

本文介绍了使用Python爬虫自动化下载dribbble网站设计师Gal Shir作品的过程，涉及selenium模拟浏览器登录、BeautifulSoup解析HTML获取图片URL以及os模块管理文件下载。通过实践，作者总结了爬虫项目中需要注意的问题和解决策略。

摘要由CSDN通过智能技术生成

Bioinfo

Photo

Design

Whisper

思路

获取页面内容
获取图片网址
新建文件夹下载图片

实践操作

之前在做一篇类似蹦跳的设计，临摹 Gal Shir 的设计图，做完发现 iPhone 线条补间效果无法实现，后来换了个思路，效果不是很好，不想发，也可以看下铅笔橡皮。

然后空格(小调)老师说他下载了 dribbble 上这位设计师的所有作品，手动下载的，我突然有了点想法，寒假也想找些图片做临摹练习，手动下载多麻烦，我这么懒的人，重复这个操作上百次，可能心态会炸。所以，既然之前学习了爬虫基础(一个月的折磨史，从Python基础开始)，要不要…

在一个天气晴朗不用去实习的周末，我决定窝在家里学代码，本来以为会很快的，太天真了，坑越挖越大，最终还是爬出来了，代码没有完整展示版本，按照步骤来是没问题的，下载的图片是仅供自己学习的哈！

获取页面内容

一回生二回熟，点开我爱的设计师 Gal Shir 的作品界面，研究一下网址和图片链接，提供请求头，开始写。

刷刷写完，运行：

只爬取了一页的图片，为什么？

后来发现往下拉会出现新的图片，网页内容增加但是网址不变，这种就和之前爬取网易云评论和B站弹幕不一样，那是爬取静态网页上的信息，这次不是静态网页了，那是什么嘞！

Ajax

Ajax( Asynchronous JavaScript and XML)，解释为利用 JavaScript 在保证页面不被刷新、页面链接不改变的情况下与服务器交换数据并更新部分网页的技术。

Ajax技术的核心是 XMLHttpRequest 对象(简称 XHR ，创建此对象向服务器发送请求)。

这个时候，我去查看刷新页面出现的新文件。

好像有规律，按照规律输入网址，可以打开(这是个坑)，依旧每页最多24张，有6页，那是不是可以按照规律访

最低0.47元/天解锁文章

weixin_39624864

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。