undetected-playwright 项目使用教程

undetected-playwright 项目使用教程

undetected-playwright You know who I am undetected-playwright 项目地址: https://gitcode.com/gh_mirrors/un/undetected-playwright

1. 项目目录结构及介绍

undetected-playwright/
├── examples/
│   └── undetected_playwright/
├── .gitignore
├── LICENSE
├── README.md
├── pyproject.toml
├── requirements.txt
└── setup.py
  • examples/: 包含示例代码的目录,展示了如何使用 undetected-playwright 进行自动化测试。
  • .gitignore: 指定 Git 版本控制系统忽略的文件和目录。
  • LICENSE: 项目的开源许可证,本项目使用 Apache-2.0 许可证。
  • README.md: 项目的介绍文档,包含项目的基本信息、安装方法和使用示例。
  • pyproject.toml: 项目的配置文件,定义了项目的构建系统和依赖。
  • requirements.txt: 列出了项目运行所需的 Python 依赖包。
  • setup.py: 用于安装项目的脚本,定义了项目的元数据和依赖。

2. 项目的启动文件介绍

项目的启动文件通常是 setup.pyREADME.md 中的示例代码。以下是一个简单的启动示例:

import webbrowser
from datetime import datetime
from pathlib import Path
from playwright.sync_api import sync_playwright, Page
from undetected_playwright import Tarnished

def cache_screenshot(page: Page):
    _now = datetime.now().strftime("%Y-%m-%d")
    _suffix = f"-view-new-[datetime.now().strftime('%H%M%S')]"
    path = f"result/[_now]/sannysoft[_suffix].png"
    page.screenshot(path=path, full_page=True)
    webbrowser.open(f"file://[Path(path).resolve()]")

def main():
    args = ["--headless=new", "--dump-dom"]
    with sync_playwright() as p:
        browser = p.chromium.launch(args=args)
        context = browser.new_context(locale="en-US")
        Tarnished.apply_stealth(context)
        page = context.new_page()
        page.goto("https://bot.sannysoft.com/", wait_until="networkidle")
        cache_screenshot(page)
        browser.close()

if __name__ == "__main__":
    main()

启动文件功能介绍

  • sync_playwright: 同步版本的 Playwright API,用于启动浏览器和创建页面。
  • Tarnished.apply_stealth(context): 应用反检测技术,避免被检测为自动化工具。
  • page.goto: 导航到指定的 URL。
  • page.screenshot: 截取页面截图并保存到指定路径。
  • webbrowser.open: 打开保存的截图文件。

3. 项目的配置文件介绍

pyproject.toml

[build-system]
requires = ["setuptools>=42", "wheel"]
build-backend = "setuptools.build_meta"

[project]
name = "undetected-playwright"
version = "0.1.0"
description = "Undetected Playwright"
authors = [
    { name="QIN2DIM", email="qin2dim@example.com" }
]
dependencies = [
    "playwright",
    "requests",
    "beautifulsoup4"
]

配置文件功能介绍

  • [build-system]: 定义了构建系统的要求和后端。
  • [project]: 定义了项目的元数据,包括项目名称、版本、描述、作者和依赖。

requirements.txt

playwright
requests
beautifulsoup4

配置文件功能介绍

  • requirements.txt: 列出了项目运行所需的 Python 依赖包,可以通过 pip install -r requirements.txt 安装。

通过以上内容,您可以了解 undetected-playwright 项目的目录结构、启动文件和配置文件的基本信息,并能够根据示例代码进行项目的启动和配置。

undetected-playwright You know who I am undetected-playwright 项目地址: https://gitcode.com/gh_mirrors/un/undetected-playwright

undetected-chromedriver是一个Python库,它提供了一个无法被检测到的Chrome浏览器驱动程序,可以用于自动化测试和爬虫等场景。下面是使用undetected-chromedriver的详细步骤: 1. 安装undetected-chromedriver 可以使用pip安装undetected-chromedriver: ```python pip install undetected-chromedriver ``` 2. 导入undetected_chromedriver模块 在Python脚本中导入undetected_chromedriver模块: ```python import undetected_chromedriver.v2 as uc ``` 3. 创建Chrome浏览器实例 通过uc.Chrome()方法创建一个Chrome浏览器实例,并配置一些选项,例如: ```python options = uc.ChromeOptions() options.add_argument('--disable-gpu') options.add_argument('--disable-dev-shm-usage') options.add_argument('--no-sandbox') driver = uc.Chrome(options=options) ``` 这里的选项是为了防止Chrome浏览器实例被检测到是自动化程序而设置的。 4. 访问网页并执行操作 通过driver.get()方法访问一个网页,并执行一些操作,例如: ```python driver.get('https://www.baidu.com') search_box = driver.find_element_by_name('wd') search_box.send_keys('undetected-chromedriver') search_box.submit() ``` 这里的代码是在百度搜索框中搜索undetected-chromedriver。 5. 关闭Chrome浏览器实例 通过driver.quit()方法关闭Chrome浏览器实例: ```python driver.quit() ``` 这里的代码是关闭Chrome浏览器实例。 总之,使用undetected-chromedriver可以让Chrome浏览器实例更难被检测到是自动化程序,从而更加稳定地进行自动化测试和爬虫等操作。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

宁烈廷

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值