selenium
一、selenium简介
- selenium是一个web自动化测试工具,可以直接运行在浏览器上
- selenium支持所有主流的浏览器
- selenium可以根据我们的指令,让浏览器自动加载页面,获取需要的数据、基础页面截图等
- selenium非Python标准模块,需要安装
安装方式
pip install selenium -i http://pypi.douban.com/simple --trusted-host pypi.douban.com
安装浏览器插件
1.在此网址http://npm.taobao.org/mirrors/chromedriver/下载浏览器对应版本的文件
2.将前一文件连同解压好的ChromeDiver放入python的Scripts目录之下
二、案例
自动截图并获取网页源代码
- 需求分析:
- 使用python编写程序,自动启动浏览器对百度服务器发送请求,并对响应回来的百度主页进行截图,输出响应回来的网页源代码
from selenium import webdriver
#构造浏览器
chrome = webdriver.Chrome()
#请求的URL
chrome.get('http://www.baidu.com')
#截图操作
chrome.save_screenshot('baidu.jpg')
#获取网页源代码
html = chrome.page_source
print(html)
#退出浏览器
chrome.quit()