爬虫

最新推荐文章于 2024-04-01 13:30:49 发布

Love Ying

最新推荐文章于 2024-04-01 13:30:49 发布

阅读量129

点赞数

本文链接：https://blog.csdn.net/LOVE__YING/article/details/87866692

版权

爬虫一个网页并下载：

const https=require(‘https’) 爬的网站是http的就引入http模块，是https的就引入https模块
const fs=require(‘fs’)
let url=‘https://www.mi.com’
https.get(url, (res) => {
res.setEncoding(‘utf8’); //网页的格式是utf8，图片的格式是binary
let rawData=’’
res.on(‘data’,(chunk)=>{
rawData+=chunk
})

    res.on('end',()=>{
        fs.writeFileSync('./mi.html',rawData,'utf8')
    })
}).on('error', (e) => {

// 如果请求失败会触发error 回调
console.error(Got error: ${e.message});
}); 最后在中端打开，写入node 本文件.js 按enter即可穿件一个爬的html。

爬取一个网站 2.将网站的所有图片下载到本地

在这里插入图片描述

Love Ying

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
爬虫

爬虫一个网页并下载：const https=require(‘https’) 爬的网站是http的就引入http模块，是https的就引入https模块const fs=require(‘fs’)let url=‘https://www.mi.com’https.get(url, (res) =&gt; {res.setEncoding(‘utf8’); //网页的格式是...
复制链接

扫一扫