[python爬虫] Selenium常见元素定位方法和操作的学习介绍

最新推荐文章于 2022-12-28 18:56:57 发布

SayDream

最新推荐文章于 2022-12-28 18:56:57 发布

阅读量683

点赞数

分类专栏：测试文章标签： selenium python

测试专栏收录该内容

11 篇文章 0 订阅

订阅专栏

文章来源：http://www.2cto.com/kf/201607/525120.html

纯粹为了个人记录，建议大家查看上述原文链接

一. 定位元素方法

官网地址：http://selenium-python.readthedocs.org/locating-elements.html
这里有各种策略用于定位网页中的元素(locate elements)，你可以选择最适合的方案，Selenium提供了一下方法来定义一个页面中的元素：

find_element_by_idfind_element_by_namefind_element_by_xpathfind_element_by_link_textfind_element_by_partial_link_textfind_element_by_tag_namefind_element_by_class_namefind_element_by_css_selector 下面是查找多个元素（这些方法将返回一个列表）：
find_elements_by_namefind_elements_by_xpathfind_elements_by_link_textfind_elements_by_partial_link_textfind_elements_by_tag_namefind_elements_by_class_namefind_elements_by_css_selector

除了上面给出的公共方法，这里也有两个在页面对象定位器有用的私有方法。这两个私有方法是find_element和find_elements。
常用方法是通过xpath相对路径进行定位，同时CSS也是比较好的方法。举例：

1

2

3

4

5

6

 
        <form id= 
        "loginForm" 
        > 
       
 
          
        <input name= 
        "username" 
        type= 
        "text" 
        > 
       
 
          
        <input name= 
        "password" 
        type= 
        "password" 
        > 
       
 
          
        <input name= 
        "continue" 
        type= 
        "submit" 
        value= 
        "Login" 
        > 
       
 
          
        <input name= 
        "continue" 
        type= 
        "button" 
        value= 
        "Clear" 
        > 
       
 
        </form> 
       

1

定位username元素的方法如下：

1

2

3

 
        username = driver.find_element_by_xpath( 
        "//form[input/@name='username']" 
        ) 
       
 
        username = driver.find_element_by_xpath( 
        "//form[@id='loginForm']/input[1]" 
        ) 
       
 
        username = driver.find_element_by_xpath( 
        "//input[@name='username']" 
        ) 
       

[1] 第一个form元素通过一个input子元素，name属性和值为username实现
[2] 通过id=loginForm值的form元素找到第一个input子元素
[3] 属性名为name且值为username的第一个input元素

二. 操作元素方法

在讲述完定位对象(locate elements)之后我们需要对该已定位对象进行操作，通常所有的操作与页面交互都将通过WebElement接口，常见的操作元素方法如下：

clear 清除元素的内容send_keys 模拟按键输入click 点击元素submit 提交表单

举例自动访问FireFox浏览器自动登录163邮箱。

 
        from selenium  
        import 
        webdriver  
       
        from selenium.webdriver.common.keys  
        import 
        Keys  
       
        import 
        time 
       
        # Login  
        163 
        email 
       
        driver = webdriver.Firefox()   
       
        driver.get( 
        "http://mail.163.com/" 
        ) 
       
        elem_user = driver.find_element_by_name( 
        "username" 
        ) 
       
        elem_user.clear 
       
        elem_user.send_keys( 
        "15201615157" 
        )  
       
        elem_pwd = driver.find_element_by_name( 
        "password" 
        ) 
       
        elem_pwd.clear 
       
        elem_pwd.send_keys( 
        "******" 
        )  
       
        elem_pwd.send_keys(Keys.RETURN) 
       
        #driver.find_element_by_id( 
        "loginBtn" 
        ).click() 
       
        #driver.find_element_by_id( 
        "loginBtn" 
        ).submit() 
       
        time.sleep( 
        5 
        )  
       
        assert 
        "baidu" 
        in driver.title   
       
        driver.close()  
       
        driver.quit()

首先通过name定位用户名和密码，再调用方法clear()清除输入框默认内容，如“请输入密码”等提示，通过send_keys("**")输入正确的用户名和密码，最后通过click()点击登录按钮或send_keys(Keys.RETURN)相当于回车登录，submit()提交表单。
PS：如果需要输入中文，防止编码错误使用send_keys(u"中文用户名")。

三. WebElement接口获取值

通过WebElement接口可以获取常用的值，这些值同样非常重要。

size 获取元素的尺寸text 获取元素的文本get_attribute(name) 获取属性值location 获取元素坐标，先找到要获取的元素，再调用该方法page_source 返回页面源码
driver.title 返回页面标题current_url 获取当前页面的URLis_displayed() 设置该元素是否可见is_enabled() 判断元素是否被使用is_selected() 判断元素是否被选中tag_name 返回元素的tagName

举例代码如下：

 
          from selenium  
          import 
          webdriver  
         
          from selenium.webdriver.common.keys  
          import 
          Keys  
         
          import 
          time 
         
          driver = webdriver.PhantomJS(executable_path= 
          "G:\phantomjs-1.9.1-windows\phantomjs.exe" 
          )   
         
          driver.get( 
          "http://www.baidu.com/" 
          ) 
         
          size = driver.find_element_by_name( 
          "wd" 
          ).size 
         
          print size 
         
          #尺寸: { 
          'width' 
          : 
          500 
          , 
          'height' 
          : 
          22 
          } 
         
          news = driver.find_element_by_xpath( 
          "//div[@id='u1']/a[1]" 
          ).text 
         
          print news 
         
          #文本: 新闻 
         
          href = driver.find_element_by_xpath( 
          "//div[@id='u1']/a[2]" 
          ).get_attribute( 
          'href' 
          ) 
         
          name = driver.find_element_by_xpath( 
          "//div[@id='u1']/a[2]" 
          ).get_attribute( 
          'name' 
          ) 
         
          print href,name 
         
          #属性值: http: 
          //www.hao123.com/ tj_trhao123 
         
          location = driver.find_element_by_xpath( 
          "//div[@id='u1']/a[3]" 
          ).location 
         
          print location 
         
          #坐标: { 
          'y' 
          : 
          19 
          , 
          'x' 
          : 
          498 
          } 
         
          print driver.current_url 
         
          #当前链接: https: 
          //www.baidu.com/ 
         
          print driver.title 
         
          #标题: 百度一下， 你就知道 
         
          result = location = driver.find_element_by_id( 
          "su" 
          ).is_displayed() 
         
          print result 
         
          #是否可见: True

其中图片解释如下图所示。

四. 鼠标操作

在现实的自动化测试中关于鼠标的操作不仅仅是click()单击操作，还有很多包含在ActionChains类中的操作。如下：

context_click(elem) 右击鼠标点击元素elem，另存为等行为double_click(elem) 双击鼠标点击元素elem，地图web可实现放大功能drag_and_drop(source,target) 拖动鼠标，源元素按下左键移动至目标元素释放move_to_element(elem) 鼠标移动到一个元素上click_and_hold(elem) 按下鼠标左键在一个元素上perform() 在通过调用该函数执行ActionChains中存储行为举例如下图所示，获取通过鼠标右键另存为百度图片logo。代码：

 
           import 
           time 
          
           from selenium  
           import 
           webdriver 
          
           from selenium.webdriver.common.keys  
           import 
           Keys 
          
           from selenium.webdriver.common.action_chains  
           import 
           ActionChains 
          
           driver = webdriver.Firefox() 
          
           driver.get( 
           "http://www.baidu.com" 
           ) 
          
           #鼠标移动至图片上 右键保存图片 
          
           elem_pic = driver.find_element_by_xpath( 
           "//div[@id='lg']/img" 
           ) 
          
           print elem_pic.get_attribute( 
           "src" 
           ) 
          
           action = ActionChains(driver).move_to_element(elem_pic) 
          
           action.context_click(elem_pic) 
          
           #重点:当右键鼠标点击键盘光标向下则移动至右键菜单第一个选项 
          
           action.send_keys(Keys.ARROW_DOWN) 
          
           time.sleep( 
           3 
           ) 
          
           action.send_keys( 
           'v' 
           ) #另存为 
          
           action.perform() 
          
           #获取另存为对话框(失败) 
          
           alert.switch_to_alert() 
          
           alert.accept()

效果如下图所示，通过xpath定位到图片位置并右击鼠标，在弹出的菜单中选择“另存为图片”。但是如何点击“另存为对话框”的“保存”按钮是个难点，目前刚学习阶段，境界没到无法解决。原因：
WebDriver cannot directly interact with dialog windows this is because dialog windows are the domain of the operating system and not the webpage.

该部分推荐参考资料：
selenium 右键下载图片，结合sikuli - tobecrazy
Selenium WebDriver 中鼠标和键盘事件分析及扩展
Selenium Windows Save/Open Open Dialouge - StackOver
书籍《selenium2 python自动化测试》作者：虫师

五. 键盘操作

参考：http://selenium-python.readthedocs.org/api.html
前面讲述了鼠标操作，现在讲述键盘操作。在webdriver的Keys类中提供了键盘所有的按键操作，当然也包括一些常见的组合键操作如Ctrl+A(全选)、Ctrl+C(复制)、Ctrl+V(粘贴)。更多键参考官方文档对应的编码。

send_keys(Keys.ENTER) 按下回车键send_keys(Keys.TAB) 按下Tab制表键send_keys(Keys.SPACE) 按下空格键spacesend_keys(Kyes.ESCAPE) 按下回退键Escsend_keys(Keys.BACK_SPACE) 按下删除键BackSpacesend_keys(Keys.SHIFT) 按下shift键send_keys(Keys.CONTROL) 按下Ctrl键send_keys(Keys.ARROW_DOWN) 按下鼠标光标向下按键send_keys(Keys.CONTROL,'a') 组合键全选Ctrl+Asend_keys(Keys.CONTROL,'c') 组合键复制Ctrl+Csend_keys(Keys.CONTROL,'x') 组合键剪切Ctrl+Xsend_keys(Keys.CONTROL,'v') 组合键粘贴Ctrl+V

这里使用的例子参考虫师的书籍《selenium2 python自动化测试》，推荐该书给大家。代码还是非常有意思的，大家自己去感受下吧~

 
             #coding=utf- 
             8 
            
             import 
             time 
            
             from selenium  
             import 
             webdriver 
            
             from selenium.webdriver.common.keys  
             import 
             Keys 
            
             driver = webdriver.Firefox() 
            
             driver.get( 
             "http://www.baidu.com" 
             ) 
            
             #输入框输入内容 
            
             elem = driver.find_element_by_id( 
             "kw" 
             ) 
            
             elem.send_keys( 
             "Eastmount CSDN" 
             ) 
            
             time.sleep( 
             3 
             ) 
            
             #删除一个字符CSDN 回退键 
            
             elem.send_keys(Keys.BACK_SPACE) 
            
             elem.send_keys(Keys.BACK_SPACE) 
            
             elem.send_keys(Keys.BACK_SPACE) 
            
             elem.send_keys(Keys.BACK_SPACE) 
            
             time.sleep( 
             3 
             ) 
            
             #输入空格+ 
             "博客" 
            
             elem.send_keys(Keys.SPACE) 
            
             elem.send_keys(u 
             "博客" 
             ) 
            
             time.sleep( 
             3 
             ) 
            
             #ctrl+a 全选输入框内容 
            
             elem.send_keys(Keys.CONTROL, 
             'a' 
             ) 
            
             time.sleep( 
             3 
             ) 
            
             #ctrl+x 剪切输入框内容 
            
             elem.send_keys(Keys.CONTROL, 
             'x' 
             ) 
            
             time.sleep( 
             3 
             ) 
            
             #输入框重新输入搜索 
            
             elem.send_keys(Keys.CONTROL, 
             'v' 
             ) 
            
             time.sleep( 
             3 
             ) 
            
             #通过回车键替代点击操作 
            
             driver.find_element_by_id( 
             "su" 
             ).send_keys(Keys.ENTER) 
            
             time.sleep( 
             3 
             ) 
            
             driver.quit()

SayDream

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
[python爬虫] Selenium常见元素定位方法和操作的学习介绍

文章来源：http://www.2cto.com/kf/201607/525120.html纯粹为了个人记录，建议大家查看上述原文链接一. 定位元素方法官网地址：http://selenium-python.readthedocs.org/locating-elements.html这里有各种策略用于定位网页中的元素(locate elements)，你
复制链接

扫一扫