【playwright】新一代自动化测试神器playwright+python系列课程49_playwright_获取网页的html或元素的html

playwright_获取网页的html或元素的html

爬虫是很多小伙伴喜欢做的事情,爬虫时需要获取到整个页面的html,playwright也提供了获取整个页面的html的功能,使用page.content()就可以实现。另外,playwright还可以获取某个元素对应的html,使用page.inner_html()可以获取。
实践代码:

'''
# author: 测试-老姜   交流微信/QQ:349940839
# 欢迎添加微信或QQ,加入学习群共同学习交流。
# QQ交流群号:877498247
# 西安的朋友欢迎当面交流。
'''

from playwright.sync_api import Playwright, sync_playwright, expect
def run(playwright: Playwright) -> None:
    browser = playwright.chromium.launch(headless=False,slow_mo=2000)
    context = browser.new_context(record_video_dir="videos") #设置录屏保存目录
    page = context.new_page()
    page.goto("http://127.0.0.1/zentao/user-login.html") # 使用相对地址
    page.locator("#account").fill("admin")
    page.locator("input[name=\"password\"]").click()
    page.locator("input[name=\"password\"]").fill("Deshifuzhi01")
    page.locator('text="登录"').click()
    r = page.content() # 获取整个页面的html
    print(r)
    loc = page.frame_locator('#appIframe-my').locator('#main')
    r = loc.inner_html() # 获取id=main的元素的html
    print(r)
    page.wait_for_timeout(10000)
    # ---------------------
    context.close() # 上下文关闭时保存录屏
    browser.close()

with sync_playwright() as playwright:
    run(playwright)
学会这两个方法的使用后,小伙伴就可以愉快的爬虫了。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值