整理下selenium的资料

参考链接:https://www.zybuluo.com/mwumli/note/222253

一份简单的测试 demo
关于 360 haosou.com 的测试 :

#coding=utf-8
from selenium import webdriver
import os
import time
# set little time stop and big time stop for viewing changes
little_time_stop = 1
big_time_stop = 2
# 默认广告条数
ads_num_require = 8
# 请求连接
req_url = "http://www.haosou.com/s?ie=utf-8&shb=1&src=360sou_newhome&q=%E9%B2%9C%E8%8A%B1"
# 打开浏览器
print "Opening chrome ..."
browser = webdriver.Chrome()
# 开始请求
print "Visit %s ..." %(req_url)
browser.get(req_url)
## 获取所有的广告
print "Get all advertisement ..."
all_ads_li = browser.find_elements_by_css_selector('#e_idea_pp li')
## 当前广告条数
ads_num_current = len(all_ads_li)
print "Has been got %d ads" %(ads_num_current)
## 如果广告条数与默认不符
if ads_num_current < ads_num_require:
    print "The number of ads is not enough ( current : %d require: %d)" %(ads_num_current,ads_num_require)
    # exit()
## 获取顶部连接
i = 0
for ads_li in all_ads_li:
    time.sleep(big_time_stop)
    i = i+1
    print "ads %d :" %i
    try:
        main = ads_li.find_element_by_css_selector('h3 a')
    except:
        print "\tError: ads %d cann't find" %(i)
    else:
        print "\tReady: visit ads %d" %(i)
        main.click()
        print "\tSucess: visit ads %d" %(i)
        time.sleep(little_time_stop)
    try:
        img_link = ads_li.find_element_by_class_name('e_biyi_img')
    except:
        print "\tError : no img in ads %d " %(i)
    else:
        print "\tReady : visit img_link %d" %(i)
        img_link.click()
        print "\tSuccess : visit img_link %d" %(i)
        time.sleep(little_time_stop)
    try:
        child_div = ads_li.find_element_by_class_name('e_biyi_childLink');
    except:
        print "\tError : no child link in ads %d" %(i)
    else:
        try:
            child_links = child_div.find_elements_by_css_selector('a')
        except:
            print "\tError : find child_links error"
        else:
            num_links = len(child_links)
            print "\tSuccess : there are %d child_links" %(num_links)
            j = 0
            for child_a in child_links:
                j = j + 1
                print "\t\tReady : visit child link %d in ads %d" %(j, i)
                child_a.click()
                print "\t\tSuccess : visit child link %d in ads %d" %(j, i)
                time.sleep(little_time_stop)
print "End and thanks for your using!"

## 延时

time.sleep(5)
## 关闭当前窗口
browser.close()
## 关闭所有已经打开的窗口
 browser.quit()

待改进
应该使用自动填充内容到搜索输入框, 然后通过点击 好搜一下 去搜索
360 haosou 的每次搜索有一个随机生成的参数 psid, 不知道有什么特别的作用
不过为了测试的准确性,应该避免这样请求
换成输入搜索内容, 这样更方便使用
应该在每一步访问后, 等待下一步执行询问
自动访问这样毕竟太快了,虽然有日志在控制台输出, 但是有些效果需要看 UI
定位操作
以下是所有定位操作的 API :

返回一个匹配元素, 即一个 WebElement 元素

find_element_by_id()
find_element_by_name()
find_element_by_class_name()
find_element_by_tag_name()
find_element_by_link_text()
find_element_by_partial_link_text()
find_element_by_xpath()
find_element_by_css_selector()

返回一个列表, 包含所有匹配的元素, 即一个 WebElement 列表

find_elements_by_id()
find_elements_by_name()
find_elements_by_class_name()
find_elements_by_tag_name()
find_elements_by_link_text()
find_elements_by_partial_link_text()
find_elements_by_xpath()
find_elements_by_css_selector()
关于 API 的具体介绍, 请参考 :
module-selenium.webdriver.chrome.webdriver

使用的时候需注意下面几点 :

python selenium 提供了两种对象 : WebDriver 和 WebElement
这两种对象都可以使用这些 API
这些 API 一旦执行失败(即查找不到), 就会抛出异常
因此必须使用 try: … except: … 机制避免错误的行为影响程序继续进行
WebDriver 调用以上 API 进行全局定位
WebElement 调用以上 API 可以进行层级定位, 即 查找当前元素的子元素
WebDriver 的使用
开始的时候必须要有初始化一个 WebDriver 实例, 即下面的 browser 用来对浏览器进行控制以及页面的访问

请求连接

req_url = “http://www.haosou.com/s?ie=utf-8&shb=1&src=360sou_newhome&q=鲜花

打开浏览器

print “Opening chrome …”
browser = webdriver.Chrome()

开始请求

print “Visit %s …” %(req_url)
browser.get(req_url)
接着, 就可以使用异常 API 进行当前页面的全局查找, 比如 :

获取所有的广告

print “Get all advertisement …”
all_ads_li = browser.find_elements_by_css_selector(’#e_idea_pp li’)
WebElement 的使用
使用 browser.find_element_by_xx() 得到的是一个 WebElement 实例
使用获得的实例调用上面的 API 即可进行层级查找

使用 browser.find_elements_by_xx() 的到的是一个元素是 WebElement 实例的 list
通过对 list 的遍历, 即可对各个实例进行相应的操作

WebDriver 的一些常用操作
browser.curren_url : 获取当前加载页面的 URL
browser.close() : 关闭当前窗口, 如果当前窗口是最后一个窗口, 浏览器将关闭
browser.quit() : 关闭所有窗口并停止 ChromeDriver 的执行
browser.add_cookie(cookie_dict) : 为当前会话添加 cookie
browser.get_cookie(name) : 得到执行 cookie
browser.get_cookies() : 得到所有的 cookie

driver.add_cookie({‘name’ : ‘foo’, ‘value’ : ‘bar’}) driver.add_cookie({‘name’ : ‘foo’, ‘value’ : ‘bar’, ‘path’ : ‘/’}) driver.add_cookie({‘name’ : ‘foo’, ‘value’ : ‘bar’, ‘path’ : ‘/’, ‘secure’:True})
browser.delete_all_cookies() : 删除当前会话的所有cookie
browser.delete_cookie(name) : 删除指定 cookie

browser.back() : 相当于浏览器的后退历史记录
browser.forward() : 相当于浏览器的前进历史记录
browser.execute_script(script, *args) : 同步执行 js 脚本
browser.execute_async_script(script, *args) : 异步执行 js 脚本
browser.get(url) : 在当前窗口加载 url
browser.refresh() : 刷新当前页面
browser.current_window_handle : 当前窗口的 handle, 相当于一个指针一样的东西, 用来指向当前窗口
browser.window_handles : 当前浏览器中的已经打开的所有窗口, 是一个 list
browser.switch_to_window(window_handle) : 切换 window_handle 指向的窗口
browser.title : 当前页面的 title
browser.name : 当前浏览器的名字
具体参照 : module-selenium.webdriver.remote.webdriver

WebElement 的一些常用操作
webEle.clear() : 清楚元素的内容, 假如这个元素是一个文本元素
webEle.click() : 点击当前元素
webEle,is_displayed() : 当前元素是否可见
webEle.is_enabled() : 当前元素是否禁止, 比如经常会禁用一些元素的点击
webEle.is_selected() : 当前元素是否选中, 文本输入框的内容
webEle.send_keys(*value) : 向当前元素模拟键盘事件
webEle.submit() : 提交表单
webEle.tag_name : 当前元素的标签名
webEle.text : 当前元素的内容
webEle.get_attribute(name) : 获取当前元素执行属性的值
具体参照 : module-selenium.webdriver.remote.webelement

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值