Selenium 简介
Selenium 是一个 Web 的自动化测试工具,类型像我们玩游戏用的按键精灵,它支持所有主流的浏览器(包括 PhantomJS 这些无界面的浏览器)。
Selenium 可以根据我们的指令,让浏览器自动加载页面,获取需要的数据,甚至页面截 屏,或者判断网站上某些动作是否发生。
Selenium 自己不带浏览器
安装方式一:PyPI 网站下载安装 https://pypi.python.org/simple/selenium
安装方式二:pip install selenium
Selenium 官方参考文档:http://selenium-python.readthedocs.io/index.html
PhantomJS 简介
PhantomJS 是一个基于 Webkit 的“无界面”(headless)浏览器非 Python 库,它会把网站加载到内存并执行页面上的 JavaScript,不会展示图形界面。
PhantomJS 官方参考文档:http://phantomjs.org/documentation
官网下载安装 http://phantomjs.org/download.html
1、解压放到:C:\phantomjs-2.1.1-windows
2、需设置环境变量,Path 添加 C:\phantomjs-2.1.1-windows\bin
3、win+R,输入 cmd 打开控制台,输入 phantomjs -v,若输出了版本号,则证明安装成功
Chrome dirver 的安装
selenium +webdriver 打开 chrome
1、以 chrome 版本 65.0.3325.181 1、打开如下页面:https://sites.google.com/a/chromium.org/chromedriver/downloads
对照下载说明,找到对应的 ChromeDriver 版本 2.38
2、打开如下网页: http://chromedriver.storage.googleapis.com/index.html
, 选取 2.38 文件夹,下载对应文件.
3、把 exe 文件放置到如下位置之一
(1)chrome 的安装目录下(eg:C:\Program Files (x86)\Google\Chrome\Application)
(2)Python 的安装目录下(eg:D:\software\Python36)
4、Path 进行编辑,在变量值后面加入 chrome 或 Python 的安装目录
用 Chrome 浏览器测试
Selenium 库里有个叫 WebDriver
的 API
。WebDriver
可以加载网站也可以查找页面元 素,与页面上的元素进行交互 (发送文本、点击等),以及执行其他动作来运行网络爬虫。
from selenium import webdriver
browser = webdriver.Chrome()
browser.get('http://www.baidu.com/')