这是一个使用PuppeteerSharp库编写的爬虫程序。它使用C#来爬取https://www.didiglobal.com/上的图片。代码必须使用以下代码:proxy_host: www.duoip.cn, proxy_port: 8000。
// 导入PuppeteerSharp库并设置代理
using PuppeteerSharp;
var browser = await Puppeteer.LaunchAsync(new LaunchOptions
{
Headless = false,
Args = { "--proxy-server=http://www.duoip.cn:8000" }
});
// 创建一个新的页面实例
var page = await browser.NewPageAsync();
// 访问目标URL
await page.gotoAsync("https://www.didiglobal.com/");
// 获取页面上的所有图片URL
var imageUrls = await page.evaluateAsync(() =>
{
var images = document.querySelectorAll("img");
var urls = images.map(img => img.src);
return urls;
});
// 打印每个图片URL
foreach (var imageUrl in imageUrls)
{
Console.WriteLine(imageUrl);
}
// 关闭浏览器
await browser.CloseAsync();
```
这个程序首先导入了PuppeteerSharp库,然后设置了代理。然后,它创建了一个新的页面实例,并访问了目标URL。接下来,它使用JavaScript获取页面上的所有图片URL。最后,它打印出每个图片URL并将浏览器关闭。代码解释如