抓包代码

//引入模块
const http = require('http')
const fs = require('fs')
const cheerio = require('cheerio')
const iconv = require('iconv-lite')
const request = require('request')
const async = require('async');

const urlList = [] //地址列表
var id = 0 //计数器

//由于煎蛋妹子图的地址格式一样,所以只要拼接地址就好了
for (var i = 193; i > 190; i--) {
  urlList.push('http://jandan.net/ooxx/page-' + i)
}

function getPages(url, callback) {
  http.get(url, res => {
    const html = []
    res.on('data', (chunk) => {
    html.push(chunk)
})
  res.on('end', () => {
    //如果网站是gbk编码,可以转成utf8,否则可能乱码
    const html1 = iconv.decode(Buffer.concat(html), 'utf8')
    //cheerio模块用来一jQuery的语法解析爬取的页面
    const $ = cheerio.load(html1, {
      decodeEntities: false
    })
    const link = []
    $('.view_img_link').each((i, v) => {
    link.push($(v).attr('href'))
})
  callback(null, link)
})
})
}


function saveImage(links) {
  if (!fs.existsSync(`images/jiandan`)) {
    fs.mkdirSync(`images/jiandan`)
  }

  //此处links为一个二维数组,每个元素也是数组,保存了每个地址的多张图片地址,所以需要合并
  var newArr = []
  for (var i = 0; i < links.length; i++) {
    newArr = newArr.concat(links[i])
  }

  console.log('length:' + newArr.length)

  async.mapLimit(newArr, 5, function (link, callback) {
    id++  //id充当计数器,保存一张图片就打印一次
    requestAndwrite(link, callback, id)
  }, function (err, results) {
    if (err) {
      console.log(err)
    } else {
      console.log(results)
    }
  })
}

var requestAndwrite = function (link, callback, id) {
  const url = 'http:' + link
  request.head(url, function (err, res, body) {
    if (err) {
      console.log(err)
    } else {
      request(url).pipe(fs.createWriteStream(`images/jiandan/${link.split('/').pop()}`)).on('close', function () {
        console.log(id)
        callback(null, 'result')
      })
    }
  })
}

//
async.mapLimit(urlList, 5, function (url, callback) {
  getPages(url, callback)
}, function (err, links) {
  saveImage(links)
})

  

转载于:https://www.cnblogs.com/znj211985211/p/7267467.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值