有时候,收藏着的微信文章就因为被删除或者和谐的原因不见了,所以我们可以用一些手段来保存成PDF来收藏。在这里我们会用puppeteer作为浏览器加载渲染文章,并且再用其保存成pdf。所以用以下的步骤:
- 创建浏览器对象打开文章页面
- 因为页面的图片是懒加载的原因,控制puppeteer浏览器缓慢滚动到底部来加载完整页面
- 调用API直接保存成PDF(当然,也可以保存成图片)
const puppeteer = require('puppeteer');
(async () => {
const browser = await puppeteer.launch({
ignoreHTTPSErrors: true
});
const page = await browser.newPage();
await page.goto('https://mp.weixin.qq.com/s/csrQkUtr22dTa9b6WvDZ-g');
await autoScroll(page);
// 获取 API 加载完,实际的页面长度
let height = await page.evaluate('document.body.scrollHeight')
let width = await page.evaluate('document.body.scrollWidth')
let params = {
printBackground: true,
scale: 1,
height: height,
width: width,
path: 'index.pdf'
}
await page.pdf(params);
//await page.s