爬虫一个网页并下载:
const https=require(‘https’) 爬的网站是http的就引入http模块,是https的就引入https模块
const fs=require(‘fs’)
let url=‘https://www.mi.com’
https.get(url, (res) => {
res.setEncoding(‘utf8’); //网页的格式是utf8,图片的格式是binary
let rawData=’’
res.on(‘data’,(chunk)=>{
rawData+=chunk
})
res.on('end',()=>{
fs.writeFileSync('./mi.html',rawData,'utf8')
})
}).on('error', (e) => {
// 如果请求失败会触发error 回调
console.error(Got error: ${e.message}
);
}); 最后在中端打开,写入node 本文件.js 按enter即可穿件一个爬的html。