用 node.js 爬取煎蛋网照片(仅做学习之用)

主要是用到 puppeteer

npm i puppeteer

具体配置看官网

入口文件

const puppeteer = require('puppeteer');
const { mn } = require('./congig/default');
const srcToImg = require('./helper/srcToimg');

(async () => {
    const browser = await puppeteer.launch();
    const page = await browser.newPage();
    // 目标网站
    await page.goto('https://image.baidu.com/search/index?tn=baiduimage&ct=201326592&lm=-1&cl=2&ie=gb18030&word=%BC%E5%B5%B0%CD%F8%B9%D9%CD%F8%C3%C3%D7%D3%CD%BC&fr=ala&ala=1&alatpl=adress&pos=0&hs=2&xthttps=111111');
    console.log('go to success');

    // 改变网站高度,这样我们就可以不用滚动,而获取更多的图片
    await page.setViewport({
        width: 1920,
        height: 4080
    });
    console.log('reset viewport');

    // await page.focus('#su');
    await page.keyboard.sendCharacter('煎蛋网官网妹子图');
    await page.click('.s_btn');
    console.log('go to search list');

    page.on('load', async () => {
        console.log('page loading done, start fetch...');

        const srcs = await page.evaluate(() => {
            const images = document.querySelectorAll('img.main_img');
            return Array.prototype.map.call(images, img => img.src);
        });
        console.log(`get ${srcs.length} images, start, download`);

        srcs.forEach( async (src) => {
            // sleep
            await page.waitFor(200);
            await srcToImg(src, mn);
        });

        await browser.close();

    });
})();

在这里插入图片描述

大概长这个样子,
具体的代码我放到了我的 gitee 上面,大家想试一下的话, git clone 下来之后, npm install 安装依赖之后,cdsrc 目录底下,运行 node mn.js (爬出时间有延迟,耐心等待一下哈)

https://gitee.com/suiboyu/node-image
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值