node.js简单爬虫

仅供学习参考!
准备工作,先安装 node.js…
之后装 request , zlib ,cheerio 等模块

const request = require(‘request’);
const zlib = require(‘zlib’);
const cheerio = require(‘cheerio’);

//开启记录cookie,重定向时自动带上cookie
//request = request.defaults({jar: true})
var options = {
url: ‘’,
encoding: null ,
followRedirect:false,
headers: {
‘User-Agent’: ‘Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36’,
// referer: ‘爬虫的url’, 这是重定向

}
}
//关闭自动重定向,检测statusCode是否302,是就先取cookie,然后再次请求并附带cookie
function callback(error, response, body) {
if(response.statusCode==302){
options.headers.cookie=response.headers[‘set-cookie’][0];
request(options, callback);
}else{
// 这里注意下 如果传回来html代码有压缩 使用以下代码进行解压,如果没有压缩直接使用 body.toString())
zlib.unzip(body, function(err, buffer) {
result(buffer.toString());
});
}
}

var arr = [];
function result(html){
var $ = cheerio.load(html);
var trs = $("#history tbody tr");
console.log(trs)
}
}
request(options, callback);

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值