puppeteer爬虫扒取数据后存入数据库

本文介绍了如何结合Puppeteer爬虫、Koa2和MySQL来实现数据抓取并存储到数据库的过程。通过分析网页结构,定位到目标数据,并利用evaluate方法获取数据。之后调用Services层,将数据存入数据库,实现爬虫与数据库的联动。文章提供了一个简单的Koa2项目,包含爬虫和数据库操作的示例代码。
摘要由CSDN通过智能技术生成

puppeteer爬虫扒取数据后存入数据库

由于最近的工作内容接触到了爬虫与测试

所以这里就记录了一个小小的例子

爬虫puppeteer + Koa2 + Mysql

是从之前koa2项目上增强了爬虫的功能

爬虫是以网易公开课的例子为例

之前koa博客地址https://blog.csdn.net/frank_come/article/details/80805032

koa项目地址https://github.com/WeForStudy/Lottery-node

红圈部分是要扒取的数据

首先我们来看一下项目目录

我们是在之前koa项目的基础上添加了爬虫的功能

新添的文件

  • reptile.js

我们来看一下

const ReptileService = require('./services/reptile')
const app = require('./index')
const puppeteer = require('puppeteer');
(async() => {
  const browser = await puppeteer.launch();
  const page = await browser.newPage();
  const url = "https://open.163.com/"
  await page.goto(url);
  const courses = await page.evaluate(() => {
    const coursesList 
  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值