爬虫

爬虫一个网页并下载:

const https=require(‘https’) 爬的网站是http的就引入http模块,是https的就引入https模块
const fs=require(‘fs’)
let url=‘https://www.mi.com
https.get(url, (res) => {
res.setEncoding(‘utf8’); //网页的格式是utf8,图片的格式是binary
let rawData=’’
res.on(‘data’,(chunk)=>{
rawData+=chunk
})

    res.on('end',()=>{
        fs.writeFileSync('./mi.html',rawData,'utf8')
    })
}).on('error', (e) => {

// 如果请求失败会触发error 回调
console.error(Got error: ${e.message});
}); 最后在中端打开,写入node 本文件.js 按enter即可穿件一个爬的html。

爬取一个网站 2.将网站的所有图片下载到本地

在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值