from loguru import logger
from playwright.async_api import async_playwright
import asyncio
class PlayWright:
def __init__(self, pageurl, headless=False, slowmo=100, timeout=30*1000) -> None:
"""
:param pageurl: str: 访问地址
:param headless: bool: 是否显示浏览器
:param slowmo: int: 操作延迟
:param timeout: int: 超时
"""
self.pageurl = pageurl
self.headless = headless
self.slowmo = slowmo
self.timeout = timeout
async def start(self, proxy=None):
"""
启动浏览器
:param proxy: dict: 代理设置
"""
self.proxy = proxy
self.browser = await self.getBrowser()
self.page = await self.newPage()
async def getBrowser(self):
"""
构造浏览器
"""
self.playwright = await async_playwright().start()
if self.proxy:
self.proxy = {'server': self.proxy}
return await self.playwright.chromium.launch(headless=self.headless, proxy=self.proxy, slow_mo=self.slowmo)
async def newPage(self):
"""
新建页面
"""
page = await self.browser.new_page()
page.set_default_timeout(self.timeout)
return page
async def gotoPage(self):
"""
访问页面
"""
try:
await self.page.goto(self.pageurl, wait_until='commit')
await self.page.wait_for_load_state('load')
logger.info(f' - 打开{self.pageurl}成功!')
except Exception:
logger.error(f' - 打开{self.pageurl}失败!')
async def cleanUp(self):
"""
关闭浏览器
"""
await self.browser.close()
await self.playwright.stop()
async def func(self):
"""
实际功能操作
"""
await self.page.locator('#kw').fill('扶苏如是')
await self.page.locator('#su').click()
async def func():
"""
主程序
"""
await p.start()
for _ in range(10):
await p.gotoPage()
await p.func()
await p.cleanUp()
if __name__ == '__main__':
p = PlayWright('https://www.baidu.com')
asyncio.run(f())
-
PlayWright 类:该类用于管理浏览器的实例和页面的操作。
__init__ 方法:初始化类的实例,接受页面 URL、是否无头模式、操作延迟和超时等参数。 start 方法:启动浏览器实例,并创建一个新的页面。 getBrowser 方法:构造浏览器实例,可以设置代理等参数。 newPage 方法:创建新的页面。 gotoPage 方法:访问指定的页面 URL。 cleanUp 方法:关闭浏览器实例,释放资源。 func 方法:执行实际的功能操作,例如在百度搜索框中填入关键词并点击搜索按钮。
-
func 函数:主程序函数,用于启动浏览器实例,循环执行页面导航和功能操作,并在结束时清理资源。
-
在 if name == ‘main’: 部分,创建了一个 PlayWright 类的实例 p,并调用 asyncio.run(f()) 运行主程序。