基于node的一个小爬虫

const https = require("https");
const cheerio = require("cheerio");
const fs = require('fs');
let url = "https://www.csdn.net/nav/web"

https.get(url, res => {
  let chunks = [];
  let size = 0;
  res.on('data', function (chunk) {
    // console.log(chunks);
    chunks.push(chunk)
    size += chunk.length
  });

  res.on('end', function () {
      console.log('数据包传输完毕');
      let data = Buffer.concat(chunks, size);
      // console.log(data);
      let html = data.toString();
      // console.log(html);
      let $ = cheerio.load(html)
      let result = []
      $("#feedlist_id").find(".list_con").each( i => {
        let map = {};
        // console.log($(".list_con").eq(i).children(".title").children("h2").children("a").text())
        map.name = $(".list_con").eq(i).children(".title").children("h2").children("a").text().trim()
        map.info = $(".list_con").eq(i).children(".summary").text().trim()
        result.push(map)
      })
      // console.log(result)
      fs.writeFile('./csdn.txt', JSON.stringify(result), { 'flag': 'a' }, function(err) {
        if(err) console.log(err);
        console.log('写入成功');
    });
  });
})
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值