selenium常用方法整理

最新推荐文章于 2024-04-28 18:35:48 发布

逻辑痒痒挠

最新推荐文章于 2024-04-28 18:35:48 发布

阅读量366

点赞数

本文链接：https://blog.csdn.net/weixin_43695063/article/details/102643015

版权

一、常用库导入

1.from selenium import webdriver 导入webdriver模块

2.from selenium.webdriver import ActionChains 导入动作链类，动作链可以储存鼠标的动作，并一起执行

3.from selenium.webdriver.common.key import Key 键盘操作使用的是Keys类,一般配合send_keys使用

4.from selenium.webdriver.support.select import Select 下拉框的操作都交由Select类进行处理

5.from selenium.webdriver.common.by import By

from selenium.webdriver.support.ui import WebDriverWait

from selenium.webdriver.support import expected_conditions as EC 显示等待使用的类

二、基本操作

1.浏览器相关操作

创建浏览器对象　　driver = webdriver.xxx()

窗口最大化　　　　maximize_window()

获取浏览器尺寸　　get_window_size()

设置浏览器尺寸　　set_window_size()

获取浏览器位置　　get_window_position()

设置浏览器位置　　set_window_position(x,y)

关闭当前标签/窗口　close()

关闭所有标签/窗口　quit()

 1 # 导入webdriver
 2 from selenium import webdriver
 3 
 4 # 创建一个浏览器对象
 5 driver = webdriver.Firefox()
 6 
 7 # 设置全屏
 8 driver.maximize_window()
 9 
10 # 获取当前浏览器尺寸
11 size = driver.get_window_size()
12 print(size)
13 
14 # 设置浏览器尺寸
15 driver.set_window_size(400, 400)
16 size = driver.get_window_size()
17 print(size)
18 
19 # 获取浏览器位置
20 position = driver.get_window_position()
21 print(position)
22 
23 # 设置浏览器位置
24 driver.set_window_position(100,200)
25 
26 
27 # 关闭浏览器
28 driver.quit()
29 driver.close()
复制代码

2.页面相关操作

请求某个url　　　　　　driver.get(url)

刷新页面操作　　　　　refresh()

回退到之前的页面　　　back()

前进到之后的页面　　　forward()

获取当前访问页面url　　current_url

获取当前浏览器标题　　title

保存图片　　　　　　　get_screenshot_as_png()/get_screenshot_as_file(file)

网页源码　　　　　　　page_source

# 导包
from selenium import webdriver
import time
# 创建浏览器对象
driver = webdriver.Firefox()

# 访问百度
url1 = 'http://www.baidu.com'
driver.get(url1)
print('访问:',url1)

# 访问知乎
url2 = 'https://zhuanlan.zhihu.com/'
time.sleep(2)
driver.get(url2)
print('访问:',url2)

# 后退操作
time.sleep(2)
driver.back()
print('后退到',url1)

# 前进
time.sleep(2)
driver.forward()
print('前进到',url2)

# 显示当前的url
print(driver.current_url)

# 显示当前的页面标题
print(driver.title)

# 保存快照操作
# 自动写文件
driver.get_screenshot_as_file('baidu.jpg')

# 自己写文件
data = driver.get_screenshot_as_png()
with open('baidu2.jpg','wb') as f:
    f.write(data)

data = driver.page_source
# 以二进制类型写入文件
with open('baidu.html','wb') as f:
    f.write(data.encode())

3.页面元素的定位（八种定位方式）

id定位　　　　　　　driver.find_element_by_id(value)

name属性值定位　　driver.find_element_by_name(value)

类名定位　　　　　 driver.find_element_by_class_name(value)

标签名定位　　　　 driver.find_element_by_tag_name(value)

链接文本定位　　　 driver.find_element_by_link_text(value)

部分链接文本　　　 driver.find_element_by_partial_link_text(value)

xpath路径表达式　　driver.find_element_by_xpath(value)

css选择器　　　　　driver.find_element_by_css_selector(value)

4.元素的操作

对元素的相关操作，一般要先获取到元素，再调用相关方法 element = driver.find_element_by_xxx(value)

点击操作　　　　element.click()

清空输入框　　　element.clear()

输入框输入数据　element.send_keys(data)

获取文本内容(既开闭标签之间的内容)　　element.text

获取属性值(获取element元素的value属性的值)　　element.get_attribute(value)

from selenium import webdriver
import time
# 创建一个浏览器
driver = webdriver.Firefox()

# 访问百度
url = 'http://www.baidu.com'
driver.get(url)

# 定位到输入框
el = driver.find_element_by_id('kw')
# 输入selenium
el.send_keys('selenium')
# 清空操作
el.clear()
# 输入python
el.send_keys('python')

# 定位到搜索按钮
el_sub = driver.find_element_by_id('su')
# 调用提交
el_sub.click()

time.sleep(5)
driver.close()

5.鼠标和键盘操作

鼠标操作需要导入类，见第一部分，然后创建对象ActionChains(driver)，键盘操作导入类见第一部分

鼠标右击

el = driver.find_element_by_xxx(value)

context_click(el)

鼠标双击

el = driver.find_element_by_xxx(value)

ActionChains(driver).double_click(el).perform()

鼠标悬停

el = driver.find_element_by_xxx(value)

ActionChains(driver).move_to_element(el).perform()

常用键盘操作

send_keys(Keys.BACK_SPACE) 删除键（BackSpace）

send_keys(Keys.SPACE) 空格键(Space)

send_keys(Keys.TAB) 制表键(Tab)

send_keys(Keys.ESCAPE) 回退键（Esc）

send_keys(Keys.ENTER) 回车键（Enter）

send_keys(Keys.CONTROL,‘a’) 全选（Ctrl+A）

send_keys(Keys.CONTROL,‘c’) 复制（Ctrl+C）

send_keys(Keys.CONTROL,‘x’) 剪切（Ctrl+X）

send_keys(Keys.CONTROL,‘v’) 粘贴（Ctrl+V）

from selenium import webdriver
#  导入动作链类
from selenium.webdriver import ActionChains

# 开浏览器
driver = webdriver.Firefox()

# 访问百度
url = 'http://www.baidu.com'
driver.get(url)

# 定位到logo元素
el_logo = driver.find_element_by_css_selector('#lg > map:nth-child(2) > area:nth-child(1)')

# 鼠标右击操作,操作元素前，需要将操作的元素定位出来并且穿入相应的动作中，如果要执行操作，需要调用perform()
ActionChains(driver).context_click(el_logo).perform()

# 双击定位到的元素，进行切换
ActionChains(driver).double_click(el_logo).perform()

# 开一个浏览器
driver = webdriver.Firefox()
driver.maximize_window()
# 访问京东
url = 'http://www.jd.com'
driver.get(url)

# 获取分类组元素
el_list = driver.find_elements_by_class_name('cate_menu_item')

#鼠标悬停
for el in el_list:
    ActionChains(driver).move_to_element(el).perform()
    time.sleep(1)
driver.quit()

6.switch_to弹出框操作

进入到弹出框中　　driver.switch_to.alert()

接收警告,确定　 accept()

关闭警告,取消　　　 dismiss()

发送文本到警告框　send_keys(data)

身份验证 authenticate(username,password)

获取alert文本内容（没有括号） text

获取焦点，然后再发送信息（active_element不加括号） driver.switch_to.active_element.send_keys(‘message’)

frame 操作

# 旧方法 ：  switch_to_     
# 新方法 ：  switch_to.   (建议使用新方法)
switch_to.frame(WebElement) # 定位网页中的frame并进去
driver.switch_to.default_content() # 从frame中回主文档
driver.switch_to.parent_frame()  # 回到上一层iframe
# 示例
# driver.switch_to.frame(0)  # 1.用frame的index来定位，第一个是0
# driver.switch_to.frame("frame1")  # 2.用id来定位
# driver.switch_to.frame("myframe")  # 3.用name来定位
# driver.switch_to.frame(driver.find_element_by_tag_name("xpath or tag_name"))  # 4.用WebElement对象来定位

7.下拉框操作

将定位到的下拉框元素传入Select类中　　selobj = Select(element)

通过索引选择，index 索引从 0 开始　　select_by_index()

通过值选择(option标签的一个属性值)　　select_by_value()

通过文本选择(下拉框的值)　　select_by_visible_text()

查看所有已选　　all_selected_options

查看第一个已选　　first_selected_option

查看是否是多选　　is_multiple

查看选项元素列表　　options

取消选择　　deselect_by_index() /deselect_by_value()/ deselect_by_visible_text()

8.滚动条操作

js = "window.scrollTo(x,y) " x为水平拖动距离，y为垂直拖动举例
driver.execute_script(js)

# 将页面滚动条滑到底部
driver.execute_script("window.scrollTo(0,document.body.scrollHeight);") 

# 将内层的滚动条滑动到底部
js = 'document.querySelector("#myDiv > div > div > div > div.portlet-body > div:nth-child(2)").scrollTop = 10000'
driver.execute_script(js)


js= "var q=document.documentElement.scrollTop=n" 
n为从顶部往下移动滚动举例
driver.execute_script(js)

#通过CSS定位到第10条搜索结果
target = driver.find_element_by_css_selector("div[id='10'] h3 a")
#利用js将定位到的元素拖动到可见区域(从上往下移动)
driver.execute_script("arguments[0].scrollIntoView();", target)
#利用js将定位到的元素拖动到可见区域(从下往上移动)
driver.execute_script("arguments[0].scrollIntoView(false);", target)

9.cookies操作

获取所有cookies　　get_cookies()

获取key对应的值　　get_cookie(key)

设置cookies　　add_cookie(cookie_dict)

删除指定名称的cookie　　delete_cookie(name)

删除所有cookie　　delete_all_cookies()

10.多标签/多窗口、多表单/多框架切换

多表单/多框架切换

直接使用id值切换进表单　　driver.switch_to.frame(value)

定位到表单元素，再切换进入

el = driver.find_element_by_xxx(value)

driver.switch_to.frame(el)

跳回最外层的页面　　driver.switch_to.default_content()

跳回上层的页面　　driver.switch_to.parent_frame()

多标签/多窗口之间的切换

获取所有窗口的句柄　　handles = driver.window_handlers

通过窗口的句柄进入的窗口　　driver.switch_to.window(handles[n])

11.add_argument 参数表

chrome_options.add_argument('--user-agent=""')  # 设置请求头的User-Agent
chrome_options.add_argument('--window-size=1280x1024')  # 设置浏览器分辨率（窗口大小）
chrome_options.add_argument('--start-maximized')  # 最大化运行（全屏窗口）,不设置，取元素会报错
chrome_options.add_argument('--disable-infobars')  # 禁用浏览器正在被自动化程序控制的提示
chrome_options.add_argument('--incognito')  # 隐身模式（无痕模式）
chrome_options.add_argument('--hide-scrollbars')  # 隐藏滚动条, 应对一些特殊页面
chrome_options.add_argument('--disable-javascript')  # 禁用javascript
chrome_options.add_argument('--blink-settings=imagesEnabled=false')  # 不加载图片, 提升速度
chrome_options.add_argument('--headless')  # 浏览器不提供可视化页面

chrome_options.add_argument('--ignore-certificate-errors')  # 禁用扩展插件并实现窗口最大化
chrome_options.add_argument('--disable-gpu')  # 禁用GPU加速
chrome_options.add_argument('–disable-software-rasterizer')
chrome_options.add_argument('--disable-extensions')
chrome_options.add_argument('--start-maximized')

逻辑痒痒挠

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
打赏
0
评论
selenium常用方法整理

一、常用库导入1.from selenium import webdriver 导入webdriver模块2.from selenium.webdriver import ActionChains 导入动作链类，动作链可以储存鼠标的动作，并一起执行3.from selenium.webdriver.common.key import Key 键盘操作使用的是Keys类,一般配合send...
复制链接

扫一扫