python爬虫爬取图片（续）

最新推荐文章于 2023-12-19 21:40:52 发布

饿了就点外卖

最新推荐文章于 2023-12-19 21:40:52 发布

阅读量1.9k

点赞数 5

文章标签： python selenium

本文链接：https://blog.csdn.net/weixin_50990952/article/details/112143421

版权

终于是放假了，上篇博客留了点尾巴，我也是放假后第“一”时间就给大家赶了出来在这里插入图片描述
没看上一篇的，请！点这里。

好，那接下来就要正式讲讲动态爬取图片了

其实动态爬虫，说白了，就是让程序模仿人为操作（例如：打开网页——打开某图片链接——选择图片（鼠标移到图片上）——右键——图片另存为）。那么，既然是要让程序模仿人为操作，先要把浏览器驱动下载好（这个可以自己去网上搜，挺多的）

这里我是以谷歌浏览器为例，做为我的程序执行浏览器。
例子网站，依然是天堂图片网

我在上篇博客里的爬虫的流程，思路，以及后期代码的具体完善讲的都差不多了，也就不重复了，下面就主要根据网页源代码来讲了。

首先，我们得先定位元素，定位元素的方法很多（class、id、xpath等等等等）先看网页源代码：
在这里插入图片描述
可以看到，我们想爬取的第一个图片集的元素被一个"class=‘il_img’"标签包起来了，那么我们用下面方法定位元素：

driver=webdriver.Chrome(r'C:\Users\VULCAN\Desktop\chromedriver.exe')#谷歌浏览器
driver.get('https://www.ivsky.com/tupian/ziranfengguang/')#访问网页
urls=driver.find_elements_by_class_name('il_img')

这里注意，find_element _······是定位一个元素，find_elements_······是定位多个元素

接着，我们点开第一个图片集。然后，我们会发现网页会变成这样：在这里插入图片描述
也就是说，我们点击第一个图片集后，会出现一个新的页面
这里注意：我们原本的网页定位是定位在第一个网页的，这里有新增加了一个网页，而网页定位是不会自己改变的。那么，这里我们得让网页定位到这个新打开的网页上就要用到switch_to_window()方法。

如果你用以下方法输出网页：

最低0.47元/天解锁文章

饿了就点外卖

关注

5
点赞
踩
12

收藏

觉得还不错? 一键收藏
1
评论
python爬虫爬取图片（续）

终于是放假了，上篇博客留了点尾巴，我也是放假后第“一”时间就给大家赶了出来没看上一篇的，请！点这。好，那接下来就要正式讲讲动态爬取图片了其实动态爬虫，说白了，就是让程序模仿人为操作（例如：打开网页——打开某图片链接——选择图片（鼠标移到图片上）——右键——图片另存为）。那么，既然是要让程序模仿人为操作，先要把浏览器驱动下载好（这个可以自己去网上搜，挺多的）这里我是以谷歌浏览器为例，做为我的程序执行浏览器。例子网站，依然是天堂图片网我在上篇博客里的爬虫的流程，思路，以及后期代码的具体完善讲的都差不
复制链接

扫一扫