node.js使用puppeteer无头浏览器爬取豆瓣电影

本文介绍了如何使用Node.js和Puppeteer库无头浏览器爬取豆瓣电影数据。在安装Puppeteer过程中,由于需要下载Chromium,可能会遇到网络问题。为解决这个问题,可以跳过install.js执行或设置环境变量防止下载,或者手动下载Chromium并指定其路径。文章提供了具体的代码示例。
摘要由CSDN通过智能技术生成

静态网站 : 数据爬取–>储存:mongodbmysql
数据服务 动态网站 –>获取 —模拟浏览器:phantomJSNightMarepuppeteer(可以做自动化。模拟真实用户访问))),或者调用api同步接口


爬虫模块puppteer 官网 https://github.com/GoogleChrome/puppeteer
安装模块:npm i puppeteer -S

可能会爆出错误 ERROR: Failed to download Chromium r515411! Set "PUPPETEER_SKIP_CHROMIUM_DOWNLOAD" env variable to skip download.

是因为在执行安装的过程中需要执行install.js,这里会下载Chromium,官网建议是进行跳过,我们可以执行—ignore-scripts 忽略这个js执行。也可以通过设置环境变量set PUPPETEER_SKIP_CHROMIUM_DOWNLOAD=1阻止下载Chromium(因为封网,直接下载会失败)

安装puppeteer: npm i --save puppeteer --ignore-scripts

报错:因为没有·chromium·文件,需要翻墙,下载地址 :https://download-chromium.appspot.com/

(node:7364) UnhandledPromiseRejectionWarning: Error: Chromium revision is not downloaded. Run "npm install" or <
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值