一、常用库导入
1.from selenium import webdriver 导入webdriver模块
2.from selenium.webdriver import ActionChains 导入动作链类,动作链可以储存鼠标的动作,并一起执行
3.from selenium.webdriver.common.key import Key 键盘操作使用的是Keys类,一般配合send_keys使用
4.from selenium.webdriver.support.select import Select 下拉框的操作都交由Select类进行处理
5.from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC 显示等待使用的类
二、基本操作
1.浏览器相关操作
创建浏览器对象 driver = webdriver.xxx()
窗口最大化 maximize_window()
获取浏览器尺寸 get_window_size()
设置浏览器尺寸 set_window_size()
获取浏览器位置 get_window_position()
设置浏览器位置 set_window_position(x,y)
关闭当前标签/窗口 close()
关闭所有标签/窗口 quit()
1 # 导入webdriver
2 from selenium import webdriver
3
4 # 创建一个浏览器对象
5 driver = webdriver.Firefox()
6
7 # 设置全屏
8 driver.maximize_window()
9
10 # 获取当前浏览器尺寸
11 size = driver.get_window_size()
12 print(size)
13
14 # 设置浏览器尺寸
15 driver.set_window_size(400, 400)
16 size = driver.get_window_size()
17 print(size)
18
19 # 获取浏览器位置
20 position = driver.get_window_position()
21 print(position)
22
23 # 设置浏览器位置
24 driver.set_window_position(100,200)
25
26
27 # 关闭浏览器
28 driver.quit()
29 driver.close()
复制代码
2.页面相关操作
请求某个url driver.get(url)
刷新页面操作 refresh()
回退到之前的页面 back()
前进到之后的页面 forward()
获取当前访问页面url current_url
获取当前浏览器标题 title
保存图片 get_screenshot_as_png()/get_screenshot_as_file(file)
网页源码 page_source
# 导包
from selenium import webdriver
import time
# 创建浏览器对象
driver = webdriver.Firefox()
# 访问百度
url1 = 'http://www.baidu.com'
driver.get(url1)
print('访问:',url1)
# 访问知乎
url2 = 'https://zhuanlan.zhihu.com/'
time.sleep(2)
driver.get(url2)
print('访问:',url2)
# 后退操作
time.sleep(2)
driver.back()
print('后退到',url1)
# 前进
time.sleep(2)
driver.forward()
print('前进到',url2)
# 显示当前的url
print(driver.current_url)
# 显示当前的页面标题
print(driver.title)
# 保存快照操作
# 自动写文件
driver.get_screenshot_as_file('baidu.jpg')
# 自己写文件
data = driver.get_screenshot_as_png()
with open('baidu2.jpg','wb') as f:
f.write(data)
data = driver.page_source
# 以二进制类型写入文件
with open('baidu.html','wb') as f:
f.write(data.encode())
3.页面元素的定位(八种定位方式)
id定位 driver.find_element_by_id(value)
name属性值定位 driver.find_element_by_name(value)
类名定位 driver.find_element_by_class_name(value)
标签名定位 driver.find_element_by_tag_name(value)
链接文本定位 driver.find_element_by_link_text(value)
部分链接文本 driver.find_element_by_partial_link_text(value)
xpath路径表达式 driver.find_element_by_xpath(value)
css选择器 driver.find_element_by_css_selector(value)
4.元素的操作
对元素的相关操作,一般要先获取到元素,再调用相关方法 element = driver.find_element_by_xxx(value)
点击操作 element.click()
清空输入框 element.clear()
输入框输入数据 element.send_keys(data)
获取文本内容(既开闭标签之间的内容) element.text
获取属性值(获取element元素的value属性的值) element.get_attribute(value)
from selenium import webdriver
import time
# 创建一个浏览器
driver = webdriver.Firefox()
# 访问百度
url = 'http://www.baidu.com'
driver.get(url)
# 定位到输入框
el = driver.find_element_by_id('kw')
# 输入selenium
el.send_keys('selenium')
# 清空操作
el.clear()
# 输入python
el.send_keys('python')
# 定位到搜索按钮
el_sub = driver.find_element_by_id('su')
# 调用提交
el_sub.click()
time.sleep(5)
driver.close()
5.鼠标和键盘操作
鼠标操作需要导入类,见第一部分,然后创建对象ActionChains(driver),键盘操作导入类见第一部分
鼠标右击
el = driver.find_element_by_xxx(value)
context_click(el)
鼠标双击
el = driver.find_element_by_xxx(value)
ActionChains(driver).double_click(el).perform()
鼠标悬停
el = driver.find_element_by_xxx(value)
ActionChains(driver).move_to_element(el).perform()
常用键盘操作
send_keys(Keys.BACK_SPACE) 删除键(BackSpace)
send_keys(Keys.SPACE) 空格键(Space)
send_keys(Keys.TAB) 制表键(Tab)
send_keys(Keys.ESCAPE) 回退键(Esc)
send_keys(Keys.ENTER) 回车键(Enter)
send_keys(Keys.CONTROL,‘a’) 全选(Ctrl+A)
send_keys(Keys.CONTROL,‘c’) 复制(Ctrl+C)
send_keys(Keys.CONTROL,‘x’) 剪切(Ctrl+X)
send_keys(Keys.CONTROL,‘v’) 粘贴(Ctrl+V)
from selenium import webdriver
# 导入动作链类
from selenium.webdriver import ActionChains
# 开浏览器
driver = webdriver.Firefox()
# 访问百度
url = 'http://www.baidu.com'
driver.get(url)
# 定位到logo元素
el_logo = driver.find_element_by_css_selector('#lg > map:nth-child(2) > area:nth-child(1)')
# 鼠标右击操作,操作元素前,需要将操作的元素定位出来并且穿入相应的动作中,如果要执行操作,需要调用perform()
ActionChains(driver).context_click(el_logo).perform()
# 双击定位到的元素,进行切换
ActionChains(driver).double_click(el_logo).perform()
# 开一个浏览器
driver = webdriver.Firefox()
driver.maximize_window()
# 访问京东
url = 'http://www.jd.com'
driver.get(url)
# 获取分类组元素
el_list = driver.find_elements_by_class_name('cate_menu_item')
#鼠标悬停
for el in el_list:
ActionChains(driver).move_to_element(el).perform()
time.sleep(1)
driver.quit()
6.switch_to弹出框操作
进入到弹出框中 driver.switch_to.alert()
接收警告,确定 accept()
关闭警告,取消 dismiss()
发送文本到警告框 send_keys(data)
身份验证 authenticate(username,password)
获取alert文本内容(没有括号) text
获取焦点,然后再发送信息(active_element不加括号) driver.switch_to.active_element.send_keys(‘message’)
frame 操作
# 旧方法 : switch_to_
# 新方法 : switch_to. (建议使用新方法)
switch_to.frame(WebElement) # 定位网页中的frame并进去
driver.switch_to.default_content() # 从frame中回主文档
driver.switch_to.parent_frame() # 回到上一层iframe
# 示例
# driver.switch_to.frame(0) # 1.用frame的index来定位,第一个是0
# driver.switch_to.frame("frame1") # 2.用id来定位
# driver.switch_to.frame("myframe") # 3.用name来定位
# driver.switch_to.frame(driver.find_element_by_tag_name("xpath or tag_name")) # 4.用WebElement对象来定位
7.下拉框操作
将定位到的下拉框元素传入Select类中 selobj = Select(element)
通过索引选择,index 索引从 0 开始 select_by_index()
通过值选择(option标签的一个属性值) select_by_value()
通过文本选择(下拉框的值) select_by_visible_text()
查看所有已选 all_selected_options
查看第一个已选 first_selected_option
查看是否是多选 is_multiple
查看选项元素列表 options
取消选择 deselect_by_index() /deselect_by_value()/ deselect_by_visible_text()
8.滚动条操作
js = "window.scrollTo(x,y) " x为水平拖动距离,y为垂直拖动举例
driver.execute_script(js)
# 将页面滚动条滑到底部
driver.execute_script("window.scrollTo(0,document.body.scrollHeight);")
# 将内层的滚动条滑动到底部
js = 'document.querySelector("#myDiv > div > div > div > div.portlet-body > div:nth-child(2)").scrollTop = 10000'
driver.execute_script(js)
js= "var q=document.documentElement.scrollTop=n"
n为从顶部往下移动滚动举例
driver.execute_script(js)
#通过CSS定位到第10条搜索结果
target = driver.find_element_by_css_selector("div[id='10'] h3 a")
#利用js将定位到的元素拖动到可见区域(从上往下移动)
driver.execute_script("arguments[0].scrollIntoView();", target)
#利用js将定位到的元素拖动到可见区域(从下往上移动)
driver.execute_script("arguments[0].scrollIntoView(false);", target)
9.cookies操作
获取所有cookies get_cookies()
获取key对应的值 get_cookie(key)
设置cookies add_cookie(cookie_dict)
删除指定名称的cookie delete_cookie(name)
删除所有cookie delete_all_cookies()
10.多标签/多窗口、多表单/多框架切换
多表单/多框架切换
直接使用id值切换进表单 driver.switch_to.frame(value)
定位到表单元素,再切换进入
el = driver.find_element_by_xxx(value)
driver.switch_to.frame(el)
跳回最外层的页面 driver.switch_to.default_content()
跳回上层的页面 driver.switch_to.parent_frame()
多标签/多窗口之间的切换
获取所有窗口的句柄 handles = driver.window_handlers
通过窗口的句柄进入的窗口 driver.switch_to.window(handles[n])
11.add_argument 参数表
chrome_options.add_argument('--user-agent=""') # 设置请求头的User-Agent
chrome_options.add_argument('--window-size=1280x1024') # 设置浏览器分辨率(窗口大小)
chrome_options.add_argument('--start-maximized') # 最大化运行(全屏窗口),不设置,取元素会报错
chrome_options.add_argument('--disable-infobars') # 禁用浏览器正在被自动化程序控制的提示
chrome_options.add_argument('--incognito') # 隐身模式(无痕模式)
chrome_options.add_argument('--hide-scrollbars') # 隐藏滚动条, 应对一些特殊页面
chrome_options.add_argument('--disable-javascript') # 禁用javascript
chrome_options.add_argument('--blink-settings=imagesEnabled=false') # 不加载图片, 提升速度
chrome_options.add_argument('--headless') # 浏览器不提供可视化页面
chrome_options.add_argument('--ignore-certificate-errors') # 禁用扩展插件并实现窗口最大化
chrome_options.add_argument('--disable-gpu') # 禁用GPU加速
chrome_options.add_argument('–disable-software-rasterizer')
chrome_options.add_argument('--disable-extensions')
chrome_options.add_argument('--start-maximized')