动态网站返回json数据乱码问题

在爬取动态网站并获取JSON数据时,可能会遇到返回数据乱码的情况。尝试设置响应编码为utf8,包括`response.encoding = 'utf8'`和`response.text.encode("utf8")`,但问题依然存在。当`response.json()`或`json.loads(response.text)`报错时,问题可能出在请求头的`Accept-Encoding`设置上。解决方案是删除或将其改为`'Accept-Encoding': 'utf-8'`,从而解决乱码问题。
摘要由CSDN通过智能技术生成

我们有时候会爬取动态网站时候需要返回json数据例如这样的数据:

但是有时候返回的数据是乱码,比如这样的:

首先我们能够想到的是不是自己没有转为utf8

response.enconding = 'utf8'是把数据转为utf8格式的文本

response.text.encode("utf8")是把文本里的数据转为utf8

两种转换又先后之分,一种是在数据返回时就转为utf8,一种是数据返回文本后再转为utf8

经历这之后你发现还是返回的一串ASCLL

response.json()或者json.loads(response.text)会报错

那你就要看看是不是你的请求头出现了问题,我也是找了好久好久好久才找到问题所在

就是这个请求头的问题,去掉这个Accept-Encoding或者改为’Accept-Encoding‘:’utf-8‘。这样就完成了!!!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值