web自动化之基础内容二（全网最详细，selenium获取断言信息，显示等待和隐式等待，xpath高级语法）-第二天

最新推荐文章于 2024-03-18 16:32:37 发布

布凡哦

最新推荐文章于 2024-03-18 16:32:37 发布

阅读量948

点赞数 22

分类专栏： web自动化文章标签：自动化 selenium

本文链接：https://blog.csdn.net/weixin_42242910/article/details/135125824

版权

web自动化专栏收录该内容

11 篇文章 0 订阅

订阅专栏

1.selenium获取断言信息

获取到的断言信息就是实际结果
预期结果使我们确定的，直接写在代码中的
而实际结果是无法确定的，所以需要用一些方法去获取

代码示例

"""
获取到的断言信息就是实际结果
预期结果使我们确定的，直接写在代码中的
而实际结果是无法确定的，所以需要用一些方法去获取
"""

from selenium import webdriver
# 创建浏览器驱动对象，这里是打开浏览器
driver = webdriver.Chrome("E:\愤怒吧小鸟\chromedriver-win64\chromedriver.exe")
#这种写法是在配置了chromedriver环境变量之后，可不写chromedriver的路径
# driver=webdriver.Chrome()
# 访问网址
driver.get('http://www.baidu.com')
#获取页面的标题
print(driver.title)  #百度一下，你就知道
# 获取当前页面的 URL
print(driver.current_url)  #https://www.baidu.com/

# 获取标签对（html的标签对）之间的文本信息
#   1、标签元素如果不展示在页面上（比如：鼠标悬停才会有内容显示的情况），获取结果为空
#   2、如果标签对中间没有值，获取到的结果也是空的
#   3、如 input 之类的单标签，获取结果也是空的
print(driver.find_element_by_class_name("title-text").text)  #百度热榜
# 获取元素的某个属性
ele = driver.find_element_by_id("kw")
print(ele.get_attribute("class"))  #s_ipt
driver.quit()

2.设置元素等待

场景：当我们加载页面的时候，一些元素是需要时间的
就有可能发生，代码执行到了，而元素没有被加载出来
此时就会出现找不到元素的情况，所以就要元素等待

元素等待大家首先都会想到time.sleep()，但是这个效率低；比如你等待1s，程序在0.3s就已经加载完成了，那就是在浪费时间；已经知道了为什么 time.sleep 不好，所以不用;

此问题的解决方案就是，在元素定位之前，进行等待，等到元素出现

所以webdriver 提供了两种等待类型：显示等待、隐式等待

2.1显示等待

显示等待，若等到元素，就不会再等了
若想使用显示等待，则必须对元素定位进行修改
也就是说，显示等待必须对具体的某个元素定位，去主动声明

举例子，再微博地址为【https://m.weibo.cn/】做一些动作

（1）点击大家都在搜

（2）点击微博热搜榜

代码示例

from selenium import webdriver
# 创建浏览器驱动对象，这里是打开浏览器
driver = webdriver.Chrome("E:\愤怒吧小鸟\chromedriver-win64\chromedriver.exe")
# 访问网址
driver.get("https://m.weibo.cn/")

# 点击大家都在搜
driver.find_element_by_xpath("/html/body/div/div/div/div/a//div").click()

# 点击微博热搜榜
ele=driver.find_element_by_css_selector("#app > div:nth-child(1) > div:nth-child(1) > div.card.m-panel.card16.m-col-2 > div > div > div:nth-child(10) > div > div > h4")
ele.click()

运行结果报错

那么我们来检验代码里的元素定位是否正确

原因（就是前文提到的）：

当我们加载页面的时候，一些元素是需要时间的
就有可能发生，代码执行到了，而元素没有被加载出来
此时就会出现找不到元素的情况

利用显示等待，优化代码

from selenium import webdriver
from selenium.webdriver.common.by import By  # 设置元素定位使用哪种方法的
from selenium.webdriver.support.ui import WebDriverWait  # 元素等待类
from selenium.webdriver.support import expected_conditions as EC  # 提供条件判断函数
# 创建浏览器驱动对象，这里是打开浏览器
driver = webdriver.Chrome("E:\愤怒吧小鸟\chromedriver-win64\chromedriver.exe")
# 访问网址
driver.get("https://m.weibo.cn/")

# 点击大家都在搜
driver.find_element_by_xpath("/html/body/div/div/div/div/a//div").click()

# 点击微博热搜榜
# ele=driver.find_element_by_css_selector("#app > div:nth-child(1) > div:nth-child(1) > div.card.m-panel.card16.m-col-2 > div > div > div:nth-child(10) > div > div > h4")


# 显示等待，若等到元素，就不会再等了
# 若想使用显示等待，则必须对元素定位进行修改
# 也就是说，显示等待必须对具体的某个元素定位，去主动声明
# 每隔 0.5s 检查一次元素是否存在，最多等待 5 s
# 若在最大超时时间内，找到元素，就不等了，继续往下执行
# 若最大超时时间还找不到元素，就报错
ele = WebDriverWait(driver, 5, 0.5).until(  # 每隔 0.5s 检查一次元素是否存在，最多等待 5 s
    EC.visibility_of_element_located(  #visibility_of_element_located()是一个函数，并且()里的对象是元组，检查元素是否被加载出来
        (By.CSS_SELECTOR,
         "#app > div:nth-child(1) > div:nth-child(1) > div.card.m-panel.card16.m-col-2 > div > div > div:nth-child(10) > div > div > h4")
    )
)
ele.click()

运行结果（显示出微博热搜界面）

可给显示等待用一个函数封装起来，要用的时候直接调用即可

新建一个waitLib.py模块

from selenium.webdriver.support.ui import WebDriverWait  # 元素等待类
from selenium.webdriver.support import expected_conditions as EC  # 提供条件判断函数

# 将显示等待封装成了函数
def waitEle(driver, timeout, poll_frequency, findType, findStr):
    ele = WebDriverWait(driver, timeout, poll_frequency).until(
        EC.visibility_of_element_located(
            (findType, findStr)
        )
    )
    return ele

2.2隐式等待

为什么有显示等待，还有隐式等待，是因为显示等待的代码比较繁琐（复杂）

（显示等待对每一个元素都要声明，但是隐式等待只需要声明一次就可以）

隐式等待默认参数是秒
当脚本执行到某个元素定位的时候，能定位就继续执行
如果不能定位，以轮询的方式(0.5s 检查一次)不断的判断元素是否能被定位
假设，在第 x(x<=最大超时时间) 秒定位到元素了，就不等了，继续往下执行
若直到最大时长还没定位成功，就抛出异常

注意：声明隐式等待后，只有声明之后的元素定位才有隐式等待，声明之前的元素定位是没有隐式等待的

显示等待和隐式等待的功能是一样的，基本上用了显示等待就不要用隐式等待，用了隐式等待就不要用显示等待，显示等待的好处：比隐式等待更节约时间（根据自己的需求选择）

代码示例

from selenium import webdriver

# 创建浏览器驱动对象，这里是打开浏览器
driver = webdriver.Chrome("E:\愤怒吧小鸟\chromedriver-win64\chromedriver.exe")

# 隐式等待默认参数是秒，如下代码，最大超时时间为 5 秒
# 当脚本执行到某个元素定位的时候，能定位就继续执行
# 如果不能定位，以轮询的方式(0.5s 检查一次)不断的判断元素是否能被定位
# 假设，在第 x(x<=最大超时时间) 秒定位到元素了，就不等了，继续往下执行
# 若直到最大时长还没定位成功，就抛出异常

#声明隐式等待
driver.implicitly_wait(5) # 声明隐式等待后，只有声明之后的元素定位才有隐式等待，声明之前的元素定位是没有隐式等待的
# 访问网址
driver.get("https://m.weibo.cn/")
# 点击大家都在搜
driver.find_element_by_xpath("/html/body/div/div/div/div/a//div").click()
# 点击微博热搜榜
driver.find_element_by_css_selector("#app > div:nth-child(1) > div:nth-child(1) > div.card.m-panel.card16.m-col-2 > div > div > div:nth-child(10) > div > div > h4").click()