spider with puppeteer

学习puppeteer 记录示例

直接上代码:

// spider.js
// 爬取美女网站的图片
const puppeteer = require('puppeteer');
const fs = require("fs");
const rp = require("request-promise");

(async () => {
  const browser = await puppeteer.launch();
  const page = await browser.newPage();
  await page.goto("http://www.haommw.com/");
  const RANK = ".grid-item .img-wrap";
  await page.waitFor(RANK);
  const res = await page.evaluate(() => {
    const getSrc = (v, selector) => {
      return v.querySelector(selector) && v.querySelector(selector).src;
    };
    const salesRank = Array.from(
      document.querySelectorAll(".grid-item .img-wrap")
    );
    const data = [];
    salesRank.map(v => {
      const obj = {
        src: getSrc(v, 'img')
      };
      data.push(obj);
    });
    return data;
  });

  res.map(async (item) => {
    let { src } = item;
    const name = src.substr(src.lastIndexOf('/'), src.length);

    let fetchResult = await rp({url: src, encoding: null});
    fs.writeFileSync(`./download/${name}`, fetchResult);
  });
  await browser.close();
})();

运行方法:

$ npm install
$ node spider.js

至此,结束。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值