node爬取网页gbk2313乱码解决办法

使用http模块爬取某个网页

出现����25�˵���<的乱码
查看网页源码的meta

<meta http-equiv="Content-Type" content="text/html; charset=gb2312" />

解决办法:

安装 iconv-lite 模块 iconv-lite

npm install iconv-lite

代码

//这里使用http请求 对其他模块比如request 和 superagent也适用
const iconv  = require('iconv-lite');
const http = require('http');
const cheerio = require('cheerio');

const targetUrl = 'https://xxx'

https.get(targetUrl, (res) => {
    let chunks = [];

    res.on('data', function(chunk) {
        chunks.push(chunk);
    });

    res.on('end', function(res) {
        let _html = iconv.decode(Buffer.concat(chunks),'gb2312');
        let $ = cheerio.load(_html);

        console.log(_html);
    });

}).on('error', function(err) {
    console.log(err);
});

乱码问题解决。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值