【测试开发】自动化测试selenium（二）——webdriver常用的API

敲代码的布莱恩特

已于 2022-03-23 11:01:57 修改

阅读量909

点赞数 5

分类专栏：测试笔记文章标签：测试工具测试用例

于 2022-03-22 13:38:17 首次发布

本文链接：https://blog.csdn.net/DerrickWestbrook/article/details/123657582

版权

笔记同时被 2 个专栏收录

69 篇文章 1 订阅

订阅专栏

测试

12 篇文章 2 订阅

订阅专栏

一个简单的脚本

在这里插入图片描述

元素的定位

注意：不管用那种方式，必须保证页面上该属性的唯一性
webdriver 提供了一系列的对象定位方法，常用的有以下几种

id
name
class name
link text
partial link text
tag name
xpath
css selector

例如：一个百度的输入框，可以用这么用种方式去定位（以下是html代码）

<input id="kw" class="s_ipt" type="text" maxlength="100" name="wd" autocomplete="off">

脚本代码：

#coding=utf-8
from selenium import webdriver
import time
browser = webdriver.Chrome()
browser.get("http://www.baidu.com")

#########百度输入框的定位方式##########
#通过id 方式定位
browser.find_element_by_id("kw").send_keys("selenium")

#通过name 方式定位
browser.find_element_by_name("wd").send_keys("selenium")

#通过tag name 方式定位
browser.find_element_by_tag_name("input").send_keys("selenium") 不能成功，因为input太多了不唯一。

#通过class name 方式定位
browser.find_element_by_class_name("s_ipt").send_keys("selenium")

#通过CSS 方式定位
browser.find_element_by_css_selector("#kw").send_keys("selenium")

#通过xphan 方式定位
browser.find_element_by_xpath("//*[@id='kw']").send_keys("selenium")

############################################
browser.find_element_by_id("su").click()
time.sleep(3)
browser.quit()

id和name定位

id 和name 是我们最最常用的定位方式，因为大多数控件都有这两个属性，而且在对控件的id 和name 命名时一般使其有意义也会取不同的名字。通过这两个属性使我们找一个页面上的属性变得相当容易。

我们通过前端工具，例如chrome的F12，找到了百度输入框的属性信息，如下：

<input id="kw" class="s_ipt" type="text" maxlength="100" name="wd" autocomplete="off">

id=”kw”
通过find_element_by_id("kw") 函数就是捕获到百度输入框

name=”wd”
通过find_element_by_name("wd")函数同样也可以捕获百度输入框

tag name 和 class name定位

从上面的百度输入框的属性信息中，我们看到，不单单只有id 和name 两个属性，

比如class 和tag name(标签名）

input 就是一个标签的名字，可以通过find_element_by_tag_name("input") 函数来定位。

class="s_ipt"，通过find_element_by_class_name("s_ipt")函数捕获百度输入框。

CSS定位

CSS(Cascading Style Sheets)是一种语言，它被用来描述HTML 和XML 文档的表现。

CSS 使用选择器来为页面元素绑定属性。这些选择器可以被selenium 用作另外的定位策略。

CSS 的比较灵活可以选择控件的任意属性，上面的例子中：
find_element_by_css_selector("#kw")

通过find_element_by_css_selector( )函数，选择取百度输入框的id 属性来定义

CSS的获取可以用chrome的F12开发者模式中Element-右键-copy-copy selector来获取
在这里插入图片描述

XPath定位

XPath 是一种在XML 文档中定位元素的语言。因为HTML 可以看做XML 的一种实现，所以selenium 用户可是使用这种强大语言在web 应用中定位元素。

XPath 扩展了上面id 和name 定位方式，提供了很多种可能性。

XPATH的获取可以用chrome的F12开发者模式中Element-右键-copy-copy xpath来获取
在这里插入图片描述

如： find_element_by_xpath("//*[@id='kw']")

link text 定位

有时候不是一个输入框也不是一个按钮，而是一个文字链接，我们可以通过link

#coding=utf-8
from selenium import webdriver
browser = webdriver.Chrome()
browser.get("http://www.baidu.com")
browser.find_element_by_link_text("hao123").click()
browser.quit()

Partial link text

定位通过部分链接定位，这个有时候也会用到，我还没有想到很好的用处。拿上面的例子，我可以只用链接的一部分文字进行匹配：

#coding=utf-8
from selenium import webdriver
browser = webdriver.Chrome()
browser.get("http://www.baidu.com")
browser.find_element_by_partial_link_text("hao").click()
browser.quit()

操作测试对象

前面讲到了不少知识都是定位元素，定位只是第一步，定位之后需要对这个原素进行操作。鼠标点击呢还是键盘输入，这要取决于我们定位的是按钮还输入框。

一般来说，webdriver 中比较常用的操作对象的方法有下面几个：

click 点击对象
send_keys 在对象上模拟按键输入
clear 清除对象的内容，如果可以的话
submit 清除对象的内容，如果可以的话
text 用于获取元素的文本信息

鼠标点击与键盘输入

#coding=utf-8
from selenium import webdriver
import time
driver = webdriver.Chrome()
driver.get("http://www.baidu.com")
time.sleep(2)
driver.find_element_by_id("kw").send_keys("test")
time.sleep(2)
driver.find_element_by_id("kw").clear()
driver.find_element_by_id("kw").send_keys("selenium")
time.sleep(2)
#通过submit() 来操作
driver.find_element_by_id("su").submit()
time.sleep(3)
driver.quit()

send_keys("xx") 用于在一个输入框里输入xx 内容。
click() 用于点击一个按钮
clear() 用于清除输入框的内容，比如百度输入框里默认有个“请输入关键字”的信息，再比如我们的登陆框一般默认会有“账号”“密码”这样的默认信息，clear 可以帮助我们清除这些信息。

submit提交表单

把“百度一下”的操作从click 换成submit 可以达到相同的效果：
driver.find_element_by_id("su").submit()

text 获取元素文本

text 用于获取元素的文本信息

#coding=utf-8
from selenium import webdriver
import time
driver = webdriver.Chrome()
driver.get("http://www.baidu.com")
time.sleep(2)
#id = cp 元素的文本信息
data=driver.find_element_by_id("cp").text
print data #打印信息
time.sleep(3)
driver.quit()

输出：
©2018 Baidu 使用百度前必读意见反馈京ICP证030173号

添加等待

添加休眠非常简单，我们需要引入time 包，就可以在脚本中自由的添加休眠时间了

import time
time.sleep(3)

智能等待

通过添加implicitly_wait() 方法就可以方便的实现智能等待；implicitly_wait(30)的用法应该比time.sleep() 更智能
后者只能选择一个固定的时间的等待，前者可以在一个时间范围内智能的等待。

# coding = utf-8
from selenium import webdriver
import time #调入time 函数
browser = webdriver.Chrome()
browser.get("http://www.baidu.com")
browser.implicitly_wait(30) #智能等待30秒
browser.find_element_by_id("kw").send_keys("selenium")
browser.find_element_by_id("su").click()
browser.quit()

两种等待的共同点：
等待够设置的时间，如果下一句执行的代码需要的元素没加载出来，都会抛出异常

打印信息

打印tile及url

#coding = utf-8
from selenium import webdriver
driver = webdriver.Chrome()
driver.get('http://www.baidu.com')
print driver.title # 把页面title 打印出来
print driver.current_url #打印url
driver.quit()

虽然没看到脚本的执行过程，但在执行结果里看到了
在这里插入图片描述
这说明页面正确被打开了

浏览器的操作

浏览器最大化

我们知道调用启动的浏览器不是全屏的，这样不会影响脚本的执行，但是有时候会影响我们“观看”脚本的执行。

#coding=utf-8
from selenium import webdriver
import time
browser = webdriver.Chrome()
browser.get("http://www.baidu.com")
print "浏览器最大化"
browser.maximize_window() #将浏览器最大化显示
time.sleep(2)
browser.find_element_by_id("kw").send_keys("selenium")
browser.find_element_by_id("su").click()
time.sleep(3)
browser.quit()

设置浏览器宽、高

最大化还是不够灵活，能不能随意的设置浏览的宽、高显示？当然是可以的。

#coding=utf-8
from selenium import webdriver
import time
browser = webdriver.Chrome()
browser.get("http://www.baidu.com")
time.sleep(2)
#参数数字为像素点
print "设置浏览器宽480、高800显示"
browser.set_window_size(480, 800) 
time.sleep(3)
browser.quit()

操作浏览器的前进、后退

浏览器上有一个后退、前进按钮，对于浏览网页的人是比较方便的；对于做web 自动化测试的同学来说应该算是一个比较难模拟的问题；其实很简单，下面看看python 的实现方式。

后退：back()
前进：forward()

#coding=utf-8
from selenium import webdriver
import time
browser = webdriver.Chrome()
#访问百度首页
first_url= 'http://www.baidu.com'
print "now access %s" %(first_url)
browser.get(first_url)
time.sleep(2)
#访问新闻页面
second_url='http://news.baidu.com'
print "now access %s" %(second_url)
browser.get(second_url)
time.sleep(2)

#返回（后退）到百度首页
print "back to %s "%(first_url)

#后退
browser.back()
time.sleep(1)

#前进到新闻页
print "forward to %s"%(second_url)

#前进
browser.forward()
time.sleep(2)
browser.quit()

控制浏览器滚动条

#coding=utf-8
from selenium import webdriver
import time
#访问百度
driver=webdriver.Chrome()
driver.get("http://www.baidu.com")
#搜索
driver.find_element_by_id("kw").send_keys("selenium")
driver.find_element_by_id("su").click()
time.sleep(3)

#将页面滚动条拖到底部
js="var q=document.documentElement.scrollTop=10000"
driver.execute_script(js)
time.sleep(3)

#将滚动条移动到页面的顶部
js="var q=document.documentElement.scrollTop=0"
driver.execute_script(js)
time.sleep(3)
driver.quit()

execute_script(script, *args)，在当前窗口/框架同步执行javaScript

键盘事件

键盘按键用法

要想调用键盘按键操作需要引入keys 包：
from selenium.webdriver.common.keys import Keys

通过send_keys()调用按键：

send_keys(Keys.TAB) # TAB
send_keys(Keys.ENTER) # 回车

#coding=utf-8
from selenium import webdriver
from selenium.webdriver.common.keys import Keys #需要引入keys 包
import os,time
driver = webdriver.Chrome()
driver.get("http://demo.zentao.net/user-login-Lw==.html")
time.sleep(3)
driver.maximize_window() # 浏览器全屏显示
driver.find_element_by_id("account").clear()
time.sleep(3)
driver.find_element_by_id("account").send_keys("demo")
time.sleep(3)
#tab 的定位相当于清除了密码框的默认提示信息，等同上面的clear()
driver.find_element_by_id("account").send_keys(Keys.TAB)
time.sleep(3)
#通过定位密码框，enter（回车）来代替登陆按钮
driver.find_element_by_name("password").send_keys(Keys.ENTER)

'''
#也可定位登陆按钮，通过enter（回车）代替click()
driver.find_element_by_id("login").send_keys(Keys.ENTER)
'''

time.sleep(3)
driver.quit()

键盘组合键用法

#coding=utf-8
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
import time
driver = webdriver.Chrome()
driver.get("http://www.baidu.com")
#输入框输入内容
driver.find_element_by_id("kw").send_keys("selenium")
time.sleep(3)
#ctrl+a 全选输入框内容
driver.find_element_by_id("kw").send_keys(Keys.CONTROL,'a')
time.sleep(3)
#ctrl+x 剪切输入框内容
driver.find_element_by_id("kw").send_keys(Keys.CONTROL,'x')
time.sleep(3)
#输入框重新输入内容，搜索
driver.find_element_by_id("kw").send_keys("webdriver")
driver.find_element_by_id("su").click()
time.sleep(3)
driver.quit()

鼠标事件

需要用到ActionChains 类

context_click() 右击
double_click() 双击
drag_and_drop() 拖动
move_to_element() 移动

#coding=utf-8
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.common.action_chains import ActionChains
import time
driver = webdriver.Chrome()
driver.get("http://news.baidu.com")
qqq =driver.find_element_by_xpath(".//*[@id='s_btn_wr']")
ActionChains(driver).context_click(qqq).perform() #右键
ActionChains(driver).double_click(qqq).perform() #双击
#定位元素的原位置
element = driver.find_element_by_id("s_btn_wr")
#定位元素要移动到的目标位置
target = driver.find_element_by_class_name("btn")
#执行元素的移动操作
ActionChains(driver).drag_and_drop(element, target).perform()

ActionChains(driver)
生成用户的行为。所有的行动都存储在actionchains 对象。通过perform()存储的行为。

move_to_element(menu)
移动鼠标到一个元素中，menu 上面已经定义了他所指向的哪一个元素

perform()
执行所有存储的行为

定位一组元素

定位一组对象一般用于以下场景：

批量操作对象，比如将页面上所有的checkbox 都勾上
先获取一组对象，再在这组对象中过滤出需要具体定位的一些对象。比如定位出页面上所有的checkbox，然后选择最后一个

这里用一个提前准备好的html演示文件

checkbox.html 访文个要与脚本放一个目录下

<html>
<head>
<meta http-equiv="content-type" content="text/html;charset=utf-8" />
<title>Checkbox</title>
</head>
<body>
<h3>checkbox</h3>
<div class="well">
<form class="form-horizontal">
<div class="control-group">
<label class="control-label" for="c1">checkbox1</label>
<div class="controls">
<input type="checkbox" id="c1" />
</div>
</div>
<div class="control-group">
<label class="control-label" for="c2">checkbox2</label>
<div class="controls">
<input type="checkbox" id="c2" />
</div>
</div>
<div class="control-group">
<label class="control-label" for="c3">checkbox3</label>
<div class="controls">
<input type="checkbox" id="c3" />
</div>
</div>
<div class="control-group">
<label class="control-label" for="r">radio</label>
<div class="controls">
<input type="radio" id="r1" />
</div>
</div>
<div class="control-group">
<label class="control-label" for="r">radio</label>
<div class="controls">
<input type="radio" id="r2" />
</div>
</div>
</form>
</div>
</body>
</html>

通过浏览器打个这个页面我们看到三个复选框和两个单选框。下面我们就来定位这三个复选框。

#coding=utf-8
from selenium import webdriver
import time
import os
dr = webdriver.Chrome()
file_path = 'file:///' + os.path.abspath('checkbox.html')
dr.get(file_path)
# 选择页面上所有的input，然后从中过滤出所有的checkbox 并勾选之
inputs = dr.find_elements_by_tag_name('input')
for input in inputs:
 if input.get_attribute('type') == 'checkbox':
 input.click()
time.sleep(2)
dr.quit()

get_attribute：获得属性值。

多层框架定位

在这里插入图片描述

#coding=utf-8
from selenium import webdriver
import time
import os
browser = webdriver.Chrome()
file_path = 'file:///' + os.path.abspath('frame.html')
browser.get(file_path)
browser.implicitly_wait(30)
#先找到到ifrome1（id = f1）
browser.switch_to_frame("f1")
#再找到其下面的ifrome2(id =f2)
browser.switch_to_frame("f2")
#下面就可以正常的操作元素了
browser.find_element_by_id("kw").send_keys("selenium")
browser.find_element_by_id("su").click()
time.sleep(3)
browser.quit()

层级定位

定位思路：
具体思路是：先点击显示出1个下拉菜单，然后再定位到该下拉菜单所在的ul，再定位这个ul 下的某个具体的link。

在这里，我们定位第1个下拉菜单中的Action 这个选项。

#coding=utf-8
from selenium import webdriver
from selenium.webdriver.support.ui import WebDriverWait
import time
import os
dr = webdriver.Chrome()
file_path = 'file:///' + os.path.abspath('level_locate.html')
dr.get(file_path)
#点击Link1链接（弹出下拉列表）
dr.find_element_by_link_text('Link1').click()
#找到id 为dropdown1的父元素
WebDriverWait(dr,10).until(lambda the_driver:
the_driver.find_element_by_id('dropdown1').is_displayed())
#在父亲元件下找到link 为Action 的子元素
menu = dr.find_element_by_id('dropdown1').find_element_by_link_text('Action')
#鼠标定位到子元素上
webdriver.ActionChains(dr).move_to_element(menu).perform()
time.sleep(2)
dr.quit()

WebDriverWait(dr, 10)
10秒内每隔500毫秒扫描1次页面变化，当出现指定的元素后结束。dr 就不解释了，前面操作webdriver.firefox()的句柄

is_displayed()
该元素是否用户可以见

下拉框处理

下拉框是我们最常见的一种页面元素，对于一般的元素，我们只需要一次就定位，但下拉框里的内容需要进行两次定位，先定位到下拉框，再定位到下拉框内里的选项。

现在我们来通过脚本选择下拉列表里的$10.69

#coding=utf-8
from selenium import webdriver
import os,time
driver= webdriver.Chrome()
file_path = 'file:///' + os.path.abspath('drop_down.html')
driver.get(file_path)
time.sleep(2)
#先定位到下拉框
m=driver.find_element_by_id("ShippingMethod")
#再点击下拉框下的选项
m.find_element_by_xpath("//option[@value='10.69']").click()
time.sleep(3)
driver.quit()

这里可能和之前的操作有所不同，首先要定位到下拉框的元素，然后选择下拉列表中的选项进行点击操作

alert、confirm、prompt 的处理

text 返回alert/confirm/prompt 中的文字信息
accept 点击确认按钮
dismiss 点击取消按钮，如果有的话
send_keys 输入值，这个alert\confirm 没有对话框就不能用了，不然会报错

注意：switch_to_alert()只能处理原生的alert

# -*- coding: utf-8 -*- 
from selenium import webdriver 
from time import sleep 
import os 
dr = webdriver.Chrome() 
file_path = 'file:///' + os.path.abspath('alert.html') 
dr.get(file_path) 
# 点击链接弹出alert 
dr.find_element_by_id('tooltip').click() 
sleep(2) 
#定位到弹出框
alert = dr.switch_to_alert() 
#点击确认
alert.accept() 
sleep(2) 
dr.quit()

例2

#接受警告信息
alert = dr.switch_to_alert() 
alert.accept() 
#得到文本信息打印
alert = dr.switch_to_alert() 
print alert.text 
#取消对话框（如果有的话）
alert = dr.switch_to_alert() 
alert.dismiss() 
#输入值
alert = dr.switch_to_alert() 
alert.send_keys("hello word")

DIV对话框的处理

更多的时候我们在实际的应用中碰到的并不是简单警告框，而是提供更多功能的会话框。

# -*- coding: utf-8 -*- 
from selenium import webdriver 
from time import sleep 
import os 
import selenium.webdriver.support.ui as ui 
dr = webdriver.Chrome() 
file_path = 'file:///' + os.path.abspath('modal.html') 
dr.get(file_path) 
# 打开对话框
dr.find_element_by_id('show_modal').click() 
sleep(3) 
# 点击对话框中的链接
link = dr.find_element_by_id('myModal').find_element_by_id('click') 
link.click() 
#dr.execute_script('$(arguments[0]).click()', link) 
sleep(4) 
# 关闭对话框
buttons =dr.find_element_by_class_name('modal-footer').find_elements_by_tag_name('button') 
buttons[0].click() 
sleep(2) 
dr.quit()

上传文件操作

文件上传操作也比较常见功能之一，上传功能没有用到新有方法或函数，关键是思路。

上传过程一般要打开一个本地窗口，从窗口选择本地文件添加。所以，一般会卡在如何操作本地窗口添加上传文件。

其实，在selenium webdriver 没我们想的那么复杂
只要定位上传按钮，通过send_keys 添加本地文件路径就可以了。绝对路径和相对路径都可以，关键是上传的文件存在。

#coding=utf-8
from selenium import webdriver
import os,time
driver = webdriver.Chrome()
#脚本要与upload_file.html 同一目录
file_path = 'file:///' + os.path.abspath('upload.html')
driver.get(file_path)
#定位上传按钮，添加本地文件
driver.find_element_by_name("file").send_keys('D:\\PycharmProjects\\test\\upload.txt')
time.sleep(2)
driver.quit()

敲代码的布莱恩特

关注

5
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
3
评论
【测试开发】自动化测试selenium（二）——webdriver常用的API

【测试开发】自动化测试selenium（二）——webdriver常用的API一个简单的脚本元素的定位id和name定位tag name 和 class name定位CSS定位XPath定位link text 定位Partial link text操作测试对象鼠标点击与键盘输入submit提交表单text 获取元素文本添加等待智能等待打印信息一个简单的脚本元素的定位注意：不管用那种方式，必须保证页面上该属性的唯一性webdriver 提供了一系列的对象定位方法，常用的有以下几种idname
复制链接

扫一扫