前端使用puppeteer 爬虫生成《React.js 小书》PDF并合并

最新推荐文章于 2024-05-28 09:37:12 发布

若川视野

最新推荐文章于 2024-05-28 09:37:12 发布

阅读量407

点赞数

本文链接：https://blog.csdn.net/u012384510/article/details/106274483

版权

前端也可以爬虫，写于2018年08月29日，现在发布到微信公众号申明原创。

掘金@若川本文章链接：https://juejin.im/post/5b86732451882542af1c8082

1、 `puppeteer` 是什么？

puppeteer: Google 官方出品的 headless Chrome node 库
puppeteer github仓库
puppeteer API

官方介绍：

您可以在浏览器中手动执行的大多数操作都可以使用 Puppeteer完成！

生成页面的屏幕截图和 PDF。
抓取 SPA并生成预渲染内容（即“ SSR”）。
自动化表单提交， UI测试，键盘输入等。
创建最新的自动化测试环境。使用最新的 JavaScript和浏览器功能直接在最新版本的 Chrome中运行测试。
捕获时间线跟踪您的网站，以帮助诊断性能问题。
测试 Chrome扩展程序。

2、爬取网站生成 `PDF`

2.1 安装 puppeteer

# 安装 puppeteer
# 可能会因为网络原因安装失败，可使用淘宝镜像
# npm install -g cnpm --registry=https://registry.npm.taobao.org
npm i puppeteer
# or "yarn add puppeteer"

2.2 《 `React.js`小书》简介

《 React.js小书》简介
关于作者@胡子大哈
这是⼀本关于 React.js 的⼩书。因为⼯作中⼀直在使⽤ React.js，也⼀直以来想总结⼀下⾃⼰关于 React.js 的⼀些知识、经验。于是把⼀些想法慢慢整理书写下来，做成⼀本开源、免费、专业、简单的⼊⻔级别的⼩书，提供给社区。希望能够帮助到更多 React.js 刚⼊⻔朋友。
下图是《 React.js 小书》部分截图：

2.3 一些可能会用到的 `puppeteer API`

// 新建 reactMiniBook.js, 运行 node reactMiniBook.js 生成pdf
const puppeteer = require('puppeteer');
(async () => {
  // 启动浏览器
  const browser = await puppeteer.launch({
        // 无界面 默认为true,改成false,则可以看到浏览器操作&#x

最低0.47元/天解锁文章

若川视野

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
前端使用puppeteer 爬虫生成《React.js 小书》PDF并合并

前端也可以爬虫，写于2018年08月29日，现在发布到微信公众号申明原创。掘金@若川本文章链接：https://juejin.im/post/5b86732451882542af1c8...
复制链接

扫一扫