selenium下载图片

本文介绍了如何利用Python的selenium库结合PhantomJS无头浏览器,实现动态网页上的图片抓取和下载。通过创建一个ImageDownload类,实现了从指定网址抓取图片,创建相应目录保存,并能自动遍历多页进行下载。注意PhantomJS解析的网页源码可能与Firefox等客户端存在差异,并且在下载过程中会检查目录是否存在,如果已存在则删除并重新创建。
摘要由CSDN通过智能技术生成
#coding:utf-8
#__author__='wang'

#phantomJS:selenium+phantomJS实现动态网站数据的爬取,该工具被称为幽灵浏览器,
也可以像浏览器一样去渲染JS加载的页面,只不过没有界面,运行速度比启动客户端又快一些

#注意:phantomJS解析的动态网页源码可能会存在和Firefox()客户端解析的动态网页源码
不一样的情况

#通过cmd命令phantomJS -v查看是否安装成功,出现版本号则可以正常使用了

import time,os
import shutil
from urllib import urlretrieve
from selenium   import webdriver

class ImageDownload(object):
    
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值