Bioinfo
Photo
Design
Whisper
思 路
获取页面内容
获取图片网址
新建文件夹下载图片
实践操作
之前在做一篇类似 蹦跳 的设计,临摹 Gal Shir 的设计图,做完发现 iPhone 线条补间效果无法实现,后来换了个思路,效果不是很好,不想发,也可以看下 铅笔橡皮 。
然后空格(小调)老师说他下载了 dribbble 上这位设计师的所有作品,手动下载的,我突然有了点想法,寒假也想找些图片做临摹练习,手动下载多麻烦,我这么懒的人,重复这个操作上百次,可能心态会炸。所以,既然之前学习了爬虫基础(一个月的折磨史,从Python基础开始),要不要…
在一个天气晴朗不用去实习的周末,我决定窝在家里学代码,本来以为会很快的,太天真了,坑越挖越大,最终还是爬出来了,代码没有完整展示版本,按照步骤来是没问题的,下载的图片是仅供自己学习的哈!
获取页面内容
一回生二回熟,点开我爱的设计师 Gal Shir 的作品界面,研究一下网址和图片链接,提供请求头,开始写。
刷刷写完,运行:
只爬取了一页的图片,为什么?
后来发现往下拉会出现新的图片,网页内容增加但是网址不变,这种就和之前爬取网易云评论和B站弹幕不一样,那是爬取静态网页上的信息,这次不是静态网页了,那是什么嘞!
Ajax
Ajax( Asynchronous JavaScript and XML),解释为利用 JavaScript 在保证页面不被刷新、页面链接不改变的情况下与服务器交换数据并更新部分网页的技术。
Ajax技术的核心是 XMLHttpRequest 对象(简称 XHR ,创建此对象向服务器发送请求)。
这个时候,我去查看刷新页面出现的新文件。
好像有规律,按照规律输入网址,可以打开(这是个坑),依旧每页最多24张,有6页,那是不是可以按照规律访