Puppeteer Sharp 教程
1. 项目介绍
Puppeteer Sharp 是一个.NET框架下的库,它是对Node.js的Puppeteer API的官方移植。这个库允许开发者以程序化的方式控制Google Chrome或Chromium浏览器,执行自动化测试、网页截图、PDF生成等任务。它基于.Net Standard 2.0,因此支持.NET Framework 4.6.1及更高版本和.NET Core 2.0及以上。
2. 项目快速启动
安装依赖
在你的解决方案中,通过NuGet安装PuppeteerSharp
包:
dotnet add package PuppeteerSharp
运行示例代码
以下是一个简单的Puppeteer Sharp脚本,用于启动浏览器,打开页面并截取网页截图:
using PuppeteerSharp;
async Task Main(string[] args)
{
// 下载浏览器二进制文件
var browserFetcher = new BrowserFetcher();
await browserFetcher.DownloadAsync();
// 启动无头浏览器
using var browser = await Puppeteer.LaunchAsync(new LaunchOptions
{
Headless = true
});
// 创建新的页面
using var page = await browser.NewPageAsync();
// 访问网页
await page.GoToAsync("http://www.google.com");
// 设置视口大小
await page.SetViewportAsync(new ViewportOptions { Width = 500, Height = 500 });
// 截图保存
await page.ScreenshotAsync("screenshot.png");
}
确保将Main
方法更新为你实际使用的异步模型(例如,ASP.NET Core中的控制器方法)。
3. 应用案例和最佳实践
-
屏幕截图
await page.ScreenshotAsync(outputFile);
-
PDF生成
await page.PdfAsync(outputFile);
-
等待函数
var watchDog = page.WaitForFunctionAsync("()=> window.innerWidth < 100");
-
连接远程浏览器
var options = new ConnectOptions { BrowserWSEndpoint = $"wss://www.externalbrowser.io/token=[apikey]" }; using var browser = await Puppeteer.ConnectAsync(options); using var page = await browser.NewPageAsync();
4. 典型生态项目
- Puppeteer Repository: https://github.com/puppeteer/puppeteer
- Puppeteer Sharp API 文档: https://www.puppeteersharp.com/api/
- Slack 频道: 参加 #puppeteer-sharp 社区讨论
- Stack Overflow 标签: 使用
puppeteer-sharp
标签提问和查找解决方案 - GitHub Issues: 提交问题和参与修复
通过以上资源,你可以更深入地学习Puppeteer Sharp,解决在实际应用中遇到的问题,并了解最新的开发动态。