selenium实现网络爬虫

最新推荐文章于 2024-05-10 16:25:53 发布

保持可爱forever

最新推荐文章于 2024-05-10 16:25:53 发布

阅读量788

点赞数

分类专栏： python python 文章标签： python 爬虫

本文为博主原创文章，未经博主允许不得转载。

本文链接：https://blog.csdn.net/W_C_X/article/details/84977819

版权

python 同时被 2 个专栏收录

23 篇文章 1 订阅

订阅专栏

9 篇文章 0 订阅

订阅专栏

感谢这篇文章的博主，笔芯

https://baijiahao.baidu.com/s?id=1600682192551404789&wfr=spider&for=pc

前两天需要从网络下载图片，于是就学了学爬虫，很多文章教程我都没看懂，但是上边链接里的看懂了。。。所以十分的感谢

从哪里获取图片呢？

我们从：https://unsplash.com，网站展示：

从哪里下手呢？

先来看一下网站的元素，因为网站都是图片，所以先找找图片的元素写在哪里

1，打开网站，点击开发者工具：

2，找到图片们的位置，对着任意一张图片，点击右键，点击查看元素，找到定位如下所示：

这些就是我们美丽的可爱的图片们的位置了

3，我们是要dang很多很多图片，也就是整个图片集，所以我们需要定位一下：

使用我们传说中的selector来定位，平时一般用xpath多一些：

python中定位语法是：find_elements_by_css_selector

鼠标放在图中所指的位置右击对css 选择器路径进行复制就行了，完美

4,可以说最重要的部分学会了，那么我们接下来就很轻松啦：

浏览器启动解析？

启动浏览器打开对应的网址，需要放大一下屏幕，滚动条向下滑一下，超级简单的。。。

图片定位？

#gridMulti img就是我们刚才复制的css 选择器，因为我们是要找每个元素的链接，也就是src，我们的image_elements获取的是网站所有的图片，相当于是个列表，所以我们需要用for循环来遍历出每个网址并打印出来，这个在结果中可以看出来在下边可以看到

如何获取图片并保存呢？

从发送的请求内容中我们来获取图片的src，也就是get方法

然后我们BytesIO实现了在内存中读写bytes，一般是操作二进制的数据，open和save方法是打开和保存这个应该都懂

format方法是字符串格式化

整合所有的代码：

是不是很简单

我们在终端运行后的结果：

只截了一小部分

我们再来看我们图片：

大功告成

保持可爱forever

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
0
评论
selenium实现网络爬虫

感谢这篇文章的博主，笔芯https://baijiahao.baidu.com/s?id=1600682192551404789&amp;wfr=spider&amp;for=pc前两天需要从网络下载图片，于是就学了学爬虫，很多文章教程我都没看懂，但是上边链接里的看懂了。。。所以十分的感谢从哪里获取图片呢？我们从：https://unsplash.com，网站展示：从哪里下...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

保持可爱forever 赞赞赞

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。