安装driver(淘宝镜像)
- chromedriver 需要对应的chrome版本
- 提示权限不足,sudo chmod +x phantomjs
基础属性和方法
- driver.page_source:网页源码
- driver.save_screenshot(“path”):页面截屏
- driver.get_cookies() : 获取所有的cookie
- driver.current_url :当前的url地址
定位元素的方法
- driver.find_element # 返回第一个元素,如果没有报错
- driver.find_elements # 返回包含元素的列表,如果没有返回空列表
获取属性和文本的方法
- 获取文本:element.text
- 获取属性值:element.get_attribute(‘href’)
切换frame(内嵌窗口)
driver.switch_to.frame()
验证码的识别
- url地址不变,验证码不变
- 请求验证码的url地址,获取响应,进行识别
- url地址不变,验证码变化
- 请求验证码,发送登录请求,需要带上统一的cookie,才能够登录成功,对应可以使用requests.Session()来实现
- selenium处理验证码
- 带上selenium的driver中的cookie来请求验证码
- selenium截屏,获取验证