Python爬虫入门-python之爬取pexels高清图片

最新推荐文章于 2024-08-03 14:18:54 发布

小佐佐123

最新推荐文章于 2024-08-03 14:18:54 发布

阅读量6.4k

点赞数 1

分类专栏： python爬虫文章标签： python 图片 ajax

本文链接：https://blog.csdn.net/suwenkun1126/article/details/78053635

版权

本文介绍了如何使用Python爬虫从Pexels网站抓取以'beauty'为关键词的高清图片。通过分析Ajax请求，发现图片链接隐藏在数据中，通过解析这些数据，提取图片URL，并用PyQuery库进行网页解析。虽然下载速度慢，但最终成功下载了图片。

摘要由CSDN通过智能技术生成

先上张图片：
小姐姐.png

首先打开网址：https://www.pexels.com/,然后下来会发现下面的图片是慢慢的加载出来的，也就是通过Ajax请求得到的。在搜索框中输入关键字：beauty,打开F12，刷新，选中XHR,然后一直下拉下拉:

分析2.png

会发现左侧中的URL只有一个page是在发生变化的，在通过对URL中参数的分析我尝试的将URL中的参数js和format去掉，构造出类似于：https://www.pexels.com/search/beauty/?page=2
其中page代表的是页数是会发生变化的，然后复制到浏览器中可以打开图片，改变page的值也没有问题。
以https://www.pexels.com/search/beauty/?page=2为例，在浏览器中打开，再打开F12刷新，切换到Preview选项卡：

分析3.png

这里面就有当前页面一张张图片的信息，我们可以通过请求这个页面，将相关图片的链接解析出来，就可以拿到我们想要的图片了。
我们打开其中一张美女图片，点击右侧的下载按钮，页面进行跳转：

分析4.png

从浏览器中发现图片的地址为:
https://static.pexels.com/photos/220423/pexels-photo-220423.jpeg
这个与上图中的 data-pin-media 属性的值很像有没有，多打开几张大图重复这个过程真是的图片的高清地址是将data-pin-media中的images替换为static即可。
下面就可以开始写代码了：
打算使