记录pyspider获取ajax接口中文乱码的问题

最新推荐文章于 2022-04-08 22:19:38 发布

一身傲气

最新推荐文章于 2022-04-08 22:19:38 发布

阅读量229

点赞数

文章标签： python 乱码

本文链接：https://blog.csdn.net/lj140524/article/details/108284413

版权

项目场景：

使用pyspider获取今日头条ajax接口数据

使用pyspider获取今日头条ajax接口数据时中文全部成了乱码

"keyword":"ç«ç¾","city":"åŒ—äº¬","tokens":["ç«ç¾"]

使用decode设置编码格式没起作用
使用sys模块同意设置编码同样没起作用

import sys  
reload(sys)  
sys.setdefaultencoding('utf8')

之后我使用requests.get发送请求发现获取的数据并没有乱码，感觉特别神奇

,"keyword":"火灾","city":"北京","tokens":["火灾"]

猜测可能是pyspider方法使用不对引起的问题（我就是个小菜鸟，只是乱猜测），开始调试代码，在将fetch_type=‘js’（这句作用是引用phantomjs获取渲染js）这段代码去掉之后发现乱码消失了，百思不得其解

如果有大佬知道这是什么原因，跪求大佬指点

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注