nodejs使用Puppeteer简单实现爬虫
1、puppeteer介绍
- 描述:puppeteer是内置了chrome内核的一个nodejs的爬虫包,基于webdriver,可实现仿人操作界面,例如页面滚动、按钮点击、导航跳转等具体功能。
- 安装:
- 全局安装:npm -g install puppeteer
- 当前项目安装:npm -S install puppeteer
- puppeteer-api puppeteer的相关api操作,可参考文档
2、node简单实现
const puppeteerTest = async () => {
const user_agent = "--user-agent=Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_5) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.183 Safari/537.36"
const options = {
headless: false,
args: ['--no-sandbox', user_agent]
};
const puppeteer = require('puppeteer');
const browser = await puppeteer.launch(options);
const page = await browser.newPage()
await page.se