puppeteer简介
puppeteer是一个node库,是Google chrome团队官方的无界面(headless)chrome工具。它提供了一组用来操纵Chrome的 API,允许通过 JS代码操纵Chrome浏览器,完成数据爬取、Web程序自动测试等任务。Puppeteer项目在GitHub上开源。
puppeteer核心功能
- 利用网页生成PDF、图片
- 爬取SPA应用,并生成预渲染内容(“SSR”服务端渲染)
- 从网站抓取内容
- 自动化表单提交、UI测试、键盘输入
- 帮助创建最新的自动化测试环境(chrome),可以直接运行测试用例
- 捕获站点的时间线,以便追踪网站,帮助分析网站性能问题
Chrome Headless环境要求
- Puppeteer要求node版本不低于v6.4.0,但是async/await只在Node v7.6.0或更高的版本支持。
- 需要最近版本的Chromium浏览器
环境安装
- 安装node 8.+
- 若已经安装了node,cmd中输入
node -v
查看node的版本。若要更新node到最新版本,只需