python爬虫爬取图片(续)

终于是放假了,上篇博客留了点尾巴,我也是放假后第“一”时间就给大家赶了出来在这里插入图片描述
没看上一篇的,请!点这里。

好,那接下来就要正式讲讲动态爬取图片了

其实动态爬虫,说白了,就是让程序模仿人为操作(例如:打开网页——打开某图片链接——选择图片(鼠标移到图片上)——右键——图片另存为)。那么,既然是要让程序模仿人为操作,先要把浏览器驱动下载好(这个可以自己去网上搜,挺多的)

这里我是以谷歌浏览器为例,做为我的程序执行浏览器。
例子网站,依然是天堂图片网

我在上篇博客里的爬虫的流程,思路,以及后期代码的具体完善讲的都差不多了,也就不重复了,下面就主要根据网页源代码来讲了。

首先,我们得先定位元素,定位元素的方法很多(class、id、xpath等等等等)先看网页源代码:
在这里插入图片描述
可以看到,我们想爬取的第一个图片集的元素被一个"class=‘il_img’"标签包起来了,那么我们用下面方法定位元素:

driver=webdriver.Chrome(r'C:\Users\VULCAN\Desktop\chromedriver.exe')#谷歌浏览器
driver.get('https://www.ivsky.com/tupian/ziranfengguang/')#访问网页
urls=driver.find_elements_by_class_name('il_img')

这里注意,find_element _······是定位一个元素,find_elements_······是定位多个元素

接着,我们点开第一个图片集。然后,我们会发现网页会变成这样:在这里插入图片描述
也就是说,我们点击第一个图片集后,会出现一个新的页面
这里注意:我们原本的网页定位是定位在第一个网页的,这里有新增加了一个网页,而网页定位是不会自己改变的。那么,这里我们得让网页定位到这个新打开的网页上就要用到switch_to_window()方法。

如果你用以下方法输出网页:

  • 5
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值