[python爬虫] Selenium常见元素定位方法和操作的学习介绍

文章来源:http://www.2cto.com/kf/201607/525120.html


纯粹为了个人记录,建议大家查看上述原文链接

一. 定位元素方法


官网地址:http://selenium-python.readthedocs.org/locating-elements.html
这里有各种策略用于定位网页中的元素(locate elements),你可以选择最适合的方案,Selenium提供了一下方法来定义一个页面中的元素:

find_element_by_idfind_element_by_namefind_element_by_xpathfind_element_by_link_textfind_element_by_partial_link_textfind_element_by_tag_namefind_element_by_class_namefind_element_by_css_selector 下面是查找多个元素(这些方法将返回一个列表):
find_elements_by_namefind_elements_by_xpathfind_elements_by_link_textfind_elements_by_partial_link_textfind_elements_by_tag_namefind_elements_by_class_namefind_elements_by_css_selector

除了上面给出的公共方法,这里也有两个在页面对象定位器有用的私有方法。这两个私有方法是find_element和find_elements。
常用方法是通过xpath相对路径进行定位,同时CSS也是比较好的方法。举例:
 

?
1
2
3
4
5
6
<form id= "loginForm" >
  <input name= "username" type= "text" >
  <input name= "password" type= "password" >
  <input name= "continue" type= "submit" value= "Login" >
  <input name= "continue" type= "button" value= "Clear" >
</form>
?
1
 
定位username元素的方法如下:
?
1
2
3
username = driver.find_element_by_xpath( "//form[input/@name='username']" )
username = driver.find_element_by_xpath( "//form[@id='loginForm']/input[1]" )
username = driver.find_element_by_xpath( "//input[@name='username']" )
[1] 第一个form元素通过一个input子元素,name属性和值为username实现
[2] 通过id=loginForm值的form元素找到第一个input子元素
[3] 属性名为name且值为username的第一个input元素

 

二. 操作元素方法

在讲述完定位对象(locate elements)之后我们需要对该已定位对象进行操作,通常所有的操作与页面交互都将通过WebElement接口,常见的操作元素方法如下:

clear 清除元素的内容send_keys 模拟按键输入click 点击元素submit 提交表单

举例自动访问FireFox浏览器自动登录163邮箱。

 

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
from selenium import webdriver 
from selenium.webdriver.common.keys import Keys 
import time
 
# Login 163 email
driver = webdriver.Firefox() 
driver.get( "http://mail.163.com/" )
 
elem_user = driver.find_element_by_name( "username" )
elem_user.clear
elem_user.send_keys( "15201615157"
elem_pwd = driver.find_element_by_name( "password" )
elem_pwd.clear
elem_pwd.send_keys( "******"
elem_pwd.send_keys(Keys.RETURN)
#driver.find_element_by_id( "loginBtn" ).click()
#driver.find_element_by_id( "loginBtn" ).submit()
time.sleep( 5
assert "baidu" in driver.title 
driver.close() 
driver.quit()
首先通过name定位用户名和密码,再调用方法clear()清除输入框默认内容,如“请输入密码”等提示,通过send_keys("**")输入正确的用户名和密码,最后通过click()点击登录按钮或send_keys(Keys.RETURN)相当于回车登录,submit()提交表单。
PS:如果需要输入中文,防止编码错误使用send_keys(u"中文用户名")。
\
  

三. WebElement接口获取值

通过WebElement接口可以获取常用的值,这些值同样非常重要。

size 获取元素的尺寸text 获取元素的文本get_attribute(name) 获取属性值location 获取元素坐标,先找到要获取的元素,再调用该方法page_source 返回页面 源码
driver.title 返回页面标题current_url 获取当前页面的URLis_displayed() 设置该元素是否可见is_enabled() 判断元素是否被使用is_selected() 判断元素是否被选中tag_name 返回元素的tagName

举例代码如下:

 

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
from selenium import webdriver 
from selenium.webdriver.common.keys import Keys 
import time
 
driver = webdriver.PhantomJS(executable_path= "G:\phantomjs-1.9.1-windows\phantomjs.exe" )  
driver.get( "http://www.baidu.com/" )
 
size = driver.find_element_by_name( "wd" ).size
print size
#尺寸: { 'width' : 500 , 'height' : 22 }
 
news = driver.find_element_by_xpath( "//div[@id='u1']/a[1]" ).text
print news
#文本: 新闻
 
href = driver.find_element_by_xpath( "//div[@id='u1']/a[2]" ).get_attribute( 'href' )
name = driver.find_element_by_xpath( "//div[@id='u1']/a[2]" ).get_attribute( 'name' )
print href,name
#属性值: http: //www.hao123.com/ tj_trhao123
 
location = driver.find_element_by_xpath( "//div[@id='u1']/a[3]" ).location
print location
#坐标: { 'y' : 19 , 'x' : 498 }
 
print driver.current_url
#当前链接: https: //www.baidu.com/
print driver.title
#标题: 百度一下, 你就知道
 
result = location = driver.find_element_by_id( "su" ).is_displayed()
print result
#是否可见: True
其中图片解释如下图所示。
\

 


 

 

四. 鼠标操作

在现实的自动化测试中关于鼠标的操作不仅仅是click()单击操作,还有很多包含在ActionChains类中的操作。如下:

context_click(elem) 右击鼠标点击元素elem,另存为等行为double_click(elem) 双击鼠标点击元素elem,地图web可实现放大功能drag_and_drop(source,target) 拖动鼠标,源元素按下左键移动至目标元素释放move_to_element(elem) 鼠标移动到一个元素上click_and_hold(elem) 按下鼠标左键在一个元素上perform() 在通过调用该函数执行ActionChains中存储行为 举例如下图所示,获取通过鼠标右键另存为百度图片logo。代码:
?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
import time
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.common.action_chains import ActionChains
 
driver = webdriver.Firefox()
driver.get( "http://www.baidu.com" )
 
#鼠标移动至图片上 右键保存图片
elem_pic = driver.find_element_by_xpath( "//div[@id='lg']/img" )
print elem_pic.get_attribute( "src" )
action = ActionChains(driver).move_to_element(elem_pic)
action.context_click(elem_pic)
 
#重点:当右键鼠标点击键盘光标向下则移动至右键菜单第一个选项
action.send_keys(Keys.ARROW_DOWN)
time.sleep( 3 )
action.send_keys( 'v' ) #另存为
action.perform()
 
#获取另存为对话框(失败)
alert.switch_to_alert()
alert.accept()

效果如下图所示,通过xpath定位到图片位置并右击鼠标,在弹出的菜单中选择“另存为图片”。但是如何点击“另存为对话框”的“保存”按钮是个难点,目前刚学习阶段,境界没到无法解决。原因:
WebDriver cannot directly interact with dialog windows this is because dialog windows are the domain of the operating system and not the webpage.

\ \
该部分推荐参考资料:
selenium 右键下载图片,结合sikuli - tobecrazy
Selenium WebDriver 中鼠标和键盘事件分析及扩展
Selenium Windows Save/Open Open Dialouge - StackOver
书籍《selenium2 python自动化测试》 作者:虫师

 

五. 键盘操作

参考:http://selenium-python.readthedocs.org/api.html
前面讲述了鼠标操作,现在讲述键盘操作。在webdriver的Keys类中提供了键盘所有的按键操作,当然也包括一些常见的组合键操作如Ctrl+A(全选)、Ctrl+C(复制)、Ctrl+V(粘贴)。更多键参考官方文档对应的编码。

send_keys(Keys.ENTER) 按下回车键send_keys(Keys.TAB) 按下Tab制表键send_keys(Keys.SPACE) 按下空格键spacesend_keys(Kyes.ESCAPE) 按下回退键Escsend_keys(Keys.BACK_SPACE) 按下删除键BackSpacesend_keys(Keys.SHIFT) 按下shift键send_keys(Keys.CONTROL) 按下Ctrl键send_keys(Keys.ARROW_DOWN) 按下鼠标光标向下按键send_keys(Keys.CONTROL,'a') 组合键全选Ctrl+Asend_keys(Keys.CONTROL,'c') 组合键复制Ctrl+Csend_keys(Keys.CONTROL,'x') 组合键剪切Ctrl+Xsend_keys(Keys.CONTROL,'v') 组合键粘贴Ctrl+V

这里使用的例子参考虫师的书籍《selenium2 python自动化测试》,推荐该书给大家。代码还是非常有意思的,大家自己去感受下吧~

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
#coding=utf- 8
import time
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
 
driver = webdriver.Firefox()
driver.get( "http://www.baidu.com" )
 
#输入框输入内容
elem = driver.find_element_by_id( "kw" )
elem.send_keys( "Eastmount CSDN" )
time.sleep( 3 )
 
#删除一个字符CSDN 回退键
elem.send_keys(Keys.BACK_SPACE)
elem.send_keys(Keys.BACK_SPACE)
elem.send_keys(Keys.BACK_SPACE)
elem.send_keys(Keys.BACK_SPACE)
time.sleep( 3 )
 
#输入空格+ "博客"
elem.send_keys(Keys.SPACE)
elem.send_keys(u "博客" )
time.sleep( 3 )
 
#ctrl+a 全选输入框内容
elem.send_keys(Keys.CONTROL, 'a' )
time.sleep( 3 )
 
#ctrl+x 剪切输入框内容
elem.send_keys(Keys.CONTROL, 'x' )
time.sleep( 3 )
 
#输入框重新输入搜索
elem.send_keys(Keys.CONTROL, 'v' )
time.sleep( 3 )
 
#通过回车键替代点击操作
driver.find_element_by_id( "su" ).send_keys(Keys.ENTER)
time.sleep( 3 )
 
driver.quit()

 


  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值