首先请确保已经安装了selenium
安装命令:pip install selenium -U
配置浏览器驱动:
IE:iedriver.exe
Firefox:geckodriver.exe
chrome:chromedriver.exe
phantomjs:phantomjs.exe
phantomjs浏览器:
phantomjs属于headless brower,是没有窗口的,所以在使用python+selenium+phantomjs来写爬虫时很方便,速度也较快。
windows配置步骤:
1、到官网下载最新版本: http://phantomjs.org/
2、解压缩
3、配置系统环境变量Path,将phantomjs.exe 解压后的目录添加到Path后即可。
在使用过程中可能会报 ‘phantomjs.exe’excutable needs to be in PATH 的错,此时有两种解决方案:
第一种方法:直接将phantomjs.exe放到python的script目录下。例如:python的script路径为F:\Python3.6.1\Scripts
使用时直接 webdriver.PhantomJS()即可
第二种方法:在使用时带上phantomjs.exe的路径。例如路径为F:\phantomjs2.1.1\bin\phantomjs.exe
使用时:webdriver.PhantomJS(executable_path=r'F:\phantomjs2.1.1\bin\phantomjs.exe') 注意路径前需要加‘r’
谷歌浏览器:
1、下载安装最新谷歌浏览器
2、下载chromedriver.exe
http://pan.baidu.com/s/1nvDRBst
3、将chromedriver.exe 放在浏览器安装目录的Application目录下。例如:C:\Program Files (x86)\Google\Chrome\Application
4、配置环境变量Path,添加C:\Program Files (x86)\Google\Chrome\Application\chromedriver.exe;
5、测试运行,使用如下代码:
# -*- coding:utf-8 -*-
from selenium import webdriver
from time import sleep
if __name__ == '__main__':
# 初始化webdriver实例
wd = webdriver.Chrome()
wd.get("https://www.baidu.com/")
sleep(5)
wd.close()
若成功打开百度且无报错证明配置成功
若出现启动浏览器失败或connect timeout等异常,说明驱动不支持当前的浏览器版本,需要重新配置。
其他浏览器的配置与Chrome相似,不再一一讲解。