文章目录
1. selenium 简介
Selenium 是最广泛使用的开源 Web UI(用户界面)自动化测试套件之一。Selenium 支持的语言包括C#,Java,Perl,PHP,Python 和 Ruby。目前,Selenium Web 驱动程序最受 Python 和 C#欢迎。 Selenium 测试脚本可以使用任何支持的编程语言进行编码,并且可以直接在大多数现代 Web 浏览器中运行。在爬虫领域 selenium 同样是一把利器,能够解决大部分的网页的反爬问题。
2. selenium 安装
首先,在Windows 命令提示符(cmd)输入:
pip install selenium
如果提示“pip不是内部或外部命令”,需要把环境变量配置好。
如果你的 pip 命令可用,但是安装的时候很慢,可以使用国内镜像
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple selenium # 使用清华大学镜像
3. selenium 浏览器驱动
3.1 selenium 驱动下载
当 selenium 升级到 3.0 之后,对不同的浏览器驱动进行了规范。如果想使用 selenium 驱动不同的浏览器,必须单独下载并设置不同的浏览器驱动。
以 Chrome浏览器驱动 为例:Chrome浏览器驱动
需要查看自己chrome 的浏览器版本去下载对应的驱动版本
路径: chrome - 设置 - 关于 chrome
3.2 selenium 驱动设置
创建一个存放浏览器驱动的目录,如: D:\driver , 将下载的浏览器驱动文件(例如:chromedrive)丢到该目录下。
我的电脑–>属性–>系统设置–>高级–>环境变量–>系统变量–>Path,将“D:\driver”目录添加到 Path 的值中。
变量名 | 变量值 |
---|---|
PATH | D:\driver |
4. 验证驱动是否可用
验证浏览器驱动是否正常使用。
from selenium import webdriver
driver = webdriver.Firefox() # Firefox 浏览器
driver = webdriver.Chrome() # Chrome 浏览器
driver = webdriver.Ie() # Internet Explorer 浏览器
driver = webdriver.Edge() # Edge 浏览器
driver = webdriver.Opera() # Opera 浏览器
driver = webdriver.PhantomJS() # PhantomJS 无头浏览器
5. selenium程序
from selenium import webdriver
driver = webdriver.Chrome() # 使用 Chrome 驱动
driver.get('https://www.baidu.com') # 操控浏览器打开百度主页
print(driver.title)
driver.quit() # 退出浏览器