爬网神器组

俗话说:预想成其事 必先利其器。选择一个熟悉的工具,是干大事的第一步, so 伟大滴NodeJS作为了我爬网神器。

一、准备工作

  • node、npm(基础设施,不必多说)
  • superagent (官网:superagent
  • cheerio(官网:cheerio

二、Code

下面展示一些 内联代码片

const request = require('superagent');
const cheerio = require('cheerio');

spiderPage(formatPageData) {
		const targetURL = 'www.baidu.com'
        return new Promise((resolve,reject)=>{
            request.get(targetURL)
            .buffer(true)
            .end((err,html)=>{
                if (err) {
                    return reject(`访问目标网站错误:${err}`);
                }
                const htmlText = html.text;
                const $ = cheerio.load(htmlText,{ decodeEntities: false });
               //使用$  去解析DoM, 获取你想要的
               //.....
            });
        });
        
    }
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值