使用Puppeteer爬取图片

使用Puppeteer爬取图片

  1. 使用的包
const puppeteer = require('puppeteer');
const request = require("request");
const fs = require('fs');
  1. 操作浏览器
var scrape = async () => {
    // 初始化无头浏览器
    const browser = await puppeteer.launch({
        headless: false,
        defaultViewport: {
            width: 1200,
            height: 1000
        }
    });
    // 新建页面
    const page = await browser.newPage();
    //搜索关键字
    let word = '壁纸'
    // 跳转到指定页面
    await page.goto('https://image.baidu.com/search/index?tn=baiduimage&ipn=r&ct=201326592&cl=2&lm=-1&st=-1&fm=index&fr=&hs=0&xthttps=111110&sf=1&fmq=&pv=&ic=0&nc=1&z=&se=1&showtab=0&fb=0&width=&height=&face=0&istype=2&ie=utf-8&word=' + word);
    await page.evaluate(function () {
    	//该页面使用懒加载,滑动屏幕让图片加载
        window.scrollTo(0,1000)
        setTimeout(()=>{window.scrollTo(0,2000)},1000)
    })
    await page.waitForTimeout(3000)
    // 获取节点
    const data = await page.evaluate( ()=> {
    	//拿到图片节点
        let dom = document.querySelectorAll('#imgid img')
        let arr = []
        for(let i=0;i<dom.length-1;i++){
            //去除base64格式
            if(!dom[i].src.includes('base64'))
            arr.push(dom[i].src) 
        }
        //返回图片链接
        return arr
    })
    //关闭浏览器
    browser.close()
    return data
}
  1. 保存图片
scrape().then((value) => {
    for(let i = 1; i < value.length-1; i++) {
        let imgUrl = value[i];
        let filename = `${new Date().getTime()}imgage${i}.png`;
        //在C盘下创建文件夹
        fs.mkdir('C:/temp',(e)=>{
            if(!e || (e&&e).code === 'EEXIST'){
                if(imgUrl)
                //保存在这个目录下
                request(imgUrl).pipe(fs.createWriteStream("C:/temp/" + filename));
                else
                console.log('地址为空')
            }
            else{
                console.log('err')
            }
        })
    }
});
  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值