扩展Playwright自动等待方法

最新推荐文章于 2025-04-07 12:28:46 发布

凌空摘星

最新推荐文章于 2025-04-07 12:28:46 发布

阅读量1.7w

点赞数 9

文章标签： python 测试工具

本文链接：https://blog.csdn.net/karl41/article/details/119883251

版权

本文探讨如何通过扩展Playwright的自动等待机制，避免使用固定等待时间，采用动态事件监听来精确判断页面加载完成，提高自动化测试的效率和稳定性。作者分享了自定义Client和Page类的方法，以及在实际项目中的应用策略。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

问题

Playwright本身自带了非常不错的自动等待机制，在 page.click(selector) page.fill(selector, value) 之类的元素操作会自动等待元素可见且可操作。但是在项目上进行应用的时候，还是会出现这样那样的问题，比如：

页面跳转后的页面操作，可能会出现错误：

playwright._impl._api_types.Error: Execution context was destroyed, most likely because of a navigation.

页面跳转后点击第一个按钮，Playwright已经发出点击，但是实际页面元素由于页面加载等原因没有接收到，导致点击操作没有生效，后续步骤无法进行。这种问题比较隐蔽，报错不固定，调试也比较困难，如点击该按钮应该要弹出新页面，结果报错如下：

playwright._impl._api_types.TimeoutError: Timeout while waiting for event "page"

页面中有iframe嵌套的情况时，如果没有iframe加载出来或者发生跳转时，会出现定位不到frame而直接返回None，导致报错：

AttributeError: 'NoneType' object has no attribute 'fill'

尝试使用Playwright自带的机制解决

以上三个问题都可以使用 page.wait_for_timeout(<timeout>) 加入固定的等待时间进行处理，但是需要在所有上述情景中加入等待，而且由于是固定等待时间，时间的长短也不好控制，过短的话没有效果，过长的话又会导致自动化测试执行时间的延长，而且页面加载时间可能是随机的、依赖环境的，无法准确预知。所以一般来说，不建议使用固定等待时间来处理。
创建浏览器对象时加入 slow_mo 参数，这样会使Playwright的每一步操作前都等待固定的时间，优点是不需要在每一步操作前进行添加，一次配置，全局可用，缺点和上面一样，本质同样是固定等待时间，而且涉及每一步操作，会更加拖慢执行速度
Playwright提供了 page.wait_for_load_state() 方法，支持3种参数 load domcontentloaded 和 networkidle ，可以等待页面加载至预期状态。但是经我测试发现这种方法并不是很好用，可以解决部分问题，但是还是有很大概率等待时间不足（即使我把三种参数都用上了）。

为了更优雅的解决这个问题，我就在Playwright的基础上进行了扩展

扩展Playwright

基本思路

必须抛弃掉固定等待时间的方法，即使用到固定等待时间，也需要在一个循环中判断达到某个条件（如元素出现）就退出循环。注意到Playwright提供了 page.on 注册回调函数的方法，那么就可以在回调函数中记录时间发生的时间，等待至一定时间内没有事件发生即为页面加载完毕（类似于networkidle ）。

实现方法

# client.py
import time
from abc import ABC, abstractmethod

from playwright.sync_api import sync_playwright, Frame, Page

class Client(ABC):
    playwright = None
    browser = None

    def __init__(self, url: str):
        self.url = url
        self.context = None
        self.main_page = None
        self.last_busy_time = time.time()

    @abstractmethod
    def register_page(self):
        pass

    def _update_busy_time(self, event=None) -> None:
        if isinstance(event, Page) or isinstance(event, Frame):
            self._register_busy_time(event)
				self.last_busy_time = time.time()

    def _register_busy_time(self, obj) -> None:
        obj.on('domcontentloaded', self._update_busy_time)
        obj.on('download', self._update_busy_time)
        obj.on('filechooser', self._update_busy_time)
        obj.on('frameattached', self._update_busy_time)
        obj.on('framedetached', self._update_busy_time)
        obj.on('framenavigated', self._update_busy_time)
        obj.on('load', self._update_busy_time)
        obj.on('pageerror', self._update_busy_time)
        obj.on('popup', self._update_busy_time)
        obj.on('request', self._update_busy_time)
        obj.on('requestfailed', self._update_busy_time)
        obj.on('requestfinished', self._update_busy_time)
        obj.on('response', self._update_busy_time)

    def start(self) -> None:
        Client.playwright = sync_playwright().start()
        Client.browser = Client.playwright.chromium.launch()
        self.context = Client.browser.new_context()
        self.main_page = self.context.new_page()
        self._register_busy_time(self.main_page)
        self.main_page.goto(self.url)
        self.register_page()

# page.py
import time

class BasePage(object):
    def __init__(self, client, page=None):
        self.client = client
        if not page:
            self.page = client.main_page
        else:
            self.page = page

    def wait_until_idle(self, timeout=1) -> None:
        while time.time() - self.client.last_busy_time < timeout:
            self.page.wait_for_timeout(100)

以上为在之前展示过的Client-Page Object模式下的实现，只保留了核心方法。

代码解析

在 Client 类中定义 last_busy_time 属性，用于记录最后一次页面事件发生的时间。
Client 类中的 _update_busy_time 方法，用于在 page.on 中注册回调方法，更新last_busy_time ，并当事件为打开新页面或frame时，在新页面或frame中对事件注册 page.on 回调（这里比较简单，只判断了事件类型，实际应用时可以根据需要定制）。
Client 类中的 _register_busy_time 方法，用于为页面事件注册回调函数（这里只是列举可能用到的事件类型，实际应根据项目特点进行定制）。
在 start 方法中创建第一个页面后，调用_register_busy_time 方法，即可将后续所有打开的页面和frame都对页面事件进行注册，只要发生对应的页面事件就会更新last_busy_time 属性为当前时间。
在 BasePage 类中定义了 wait_until_idle 方法，用于判断当页面空闲时间大于 timeout 时即停止等待，认为当前页面加载完毕，并且并且页面已经空闲的时候会即刻返回，不会增加测试执行时间。