puppeteer爬虫

一、爬虫

 //生成一个npm的仓库
npm init -y 

在这里插入图片描述

 //安装nodemon
npm i nodemon -S

在这里插入图片描述

npm i puppeteer -S

在这里插入图片描述

全局安装yarn

npm i yarn -g 
//yarn是facebook出的一个node.js的包原理方案,相对会快一些
yarn config set registry https://registry.npm.taobao.org

二、爬虫的代码

npm i koa koa-router koa2-cors -S

在这里插入图片描述

//package.json
{
  "name": "server",
  "version": "1.0.0",
  "description": "",
  "main": "index.js",
  "scripts": {
    "start": "nodemon index.js",
    "test": "echo \"Error: no test specified\" && exit 1"
  },
  "keywords": [],
  "author": "",
  "license": "ISC",
  "dependencies": {
    "nodemon": "^2.0.4",
    "puppeteer": "^3.3.0"
  }
}

//配置index.js
const run = require('./reptile/db');
const koa = require("koa");
const Router = require('koa-router');
const router = new Router();
var cors = require('koa2-cors');
const app =  new koa();
router.get("/",async ctx=>{
    var data = await run();

    ctx.body = data;
})
app.use(cors());
app.use(router.routes())
app.listen(8080)
//爬取堆糖
const puppeteer = require("puppeteer");
const url = "https://www.duitang.com/"
async function run() {
    const browser = await puppeteer.launch()
    const page = await browser.newPage();
    await page.goto(url, {
        waitUntil: 'networkidle2'
    })
    await page.waitFor(2000)
    await page.hover(".dynamic-feed-item")
    let res = await page.evaluate(() => {
        var $ = window.jQuery
        var items = $(".dynamic-feed-item")
        // .user-info .avatar  --src属性 $(".user-info .avatar").attr("src")
        // .user-info .username   $(".user-info .username").html()
        var links = [];
        if(items.length>0){
            items.each((index,item)=>{
                let avatar = $(item).find(".user-info .avatar").attr("src");
                let username = $(item).find(".user-info .username").html();
                links.push({
                    avatar:avatar,
                    username:username
                })
            })
        }
        return links;
       
    })
    console.log(res);
    browser.close();
    return res;
}
run();
// module.exports = run;
npm start

访问:http://localhost:8080/
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值