scrapy esponse.body 对乱码的处理

最新推荐文章于 2024-01-31 10:59:00 发布

苏葛

最新推荐文章于 2024-01-31 10:59:00 发布

阅读量882

点赞数 1

分类专栏：爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_15058425/article/details/87977620

版权

爬虫专栏收录该内容

2 篇文章 0 订阅

订阅专栏

在用scrapy进行数据抓取的时候，经常用如下代码，将返回的数据解析成json,然后操作数据

jsonContent = json.loads(response.body)

但是有时候会遇到response.body的内容中有中文乱码的问题，导致json.loads解析失败。解决方案如下：

1、chrome安装chartset插件，安装好之后如下图：

2、将请求的链接或接口地方放到浏览器访问

测试链接：

http://data.eastmoney.com/notices/getdata.ashx?StockCode=002172&CodeType=1&PageIndex=1&PageSize=50&SecNodeType=0&FirstNodeType=6&rt=51688099

当利用chartset设置成utf-8的编码格式时，出现了中文乱码，把编码格式修改成gbk时，则正常显示

所以在爬虫里面，将response.body进行GBK解码即可解决中文乱码问题

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
scrapy esponse.body 对乱码的处理

在用scrapy进行数据抓取的时候，经常用如下代码，将返回的数据解析成json,然后操作数据jsonContent = json.loads(response.body)但是有时候会遇到response.body的内容中有中文乱码的问题，导致json.loads解析失败。解决方案如下：1、chrome安装chartset插件，安装好之后如下图： 2、将请求的链接或接口地方...
复制链接

扫一扫

专栏目录

苏葛 CSDN认证博客专家 CSDN认证企业博客

码龄10年

161: 原创

4万+: 周排名

159万+: 总排名

55万+: 访问

: 等级

5827: 积分

36: 粉丝

114: 获赞

45: 评论

392: 收藏

私信

关注

热门文章

分类专栏

elasticsearch 5篇
springSecurity
rabbitmq学习 7篇
js插件 6篇
springmvc+mybaties 3篇
tomcat 5篇
json
数据库 29篇
java 34篇
jquey 6篇
spring+springboot 7篇
mybaties 4篇
html5&css,bootstap 3篇
javaScript 25篇
nginx 4篇
其他 4篇
Linux 30篇
Python 22篇
php 3篇
设计模式 1篇
MongoDB
前端练习 1篇
python数据分析 1篇
数据分析
R语言 13篇
docker 2篇
RabbitMQ 7篇
爬虫 2篇

最新评论

mysql 5.7 order by group by 的问题
CSDN-Ada助手: 非常感谢CSDN博主的分享，这篇博客真的帮助我解决了mysql 5.7 order by group by的问题。我觉得下一篇博客可以继续探讨mysql相关的话题，比如如何优化mysql的查询性能，或者如何使用mysql实现数据备份与恢复等。这样的技术文章对其他用户也会有很大的帮助。相信你一定能写出更好的博客，期待你的下一篇文章。为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
java Double去掉科学计数"E"
徐治松: 都会出问题的，0.00000001这种数据那种方案都不行。
linux结构化命令：for循环
牛转乾坤421: guest-o8nayv@ubuntu:~/Music$ ./ex8.sh aa is cat $file guest-o8nayv@ubuntu:~/Music$ cat ex8.sh #!/bin/bash file="counstry" for aa in 'cat $file' do echo "aa is $aa" done guest-o8nayv@ubuntu:~/Music$ cat counstry merica china japan 我这个是哪里有问题，输出不是那个答案啊
阿里云卸载mysql的问题及解决 dpkg: error processing mysql-server (--configure)
OGAS45: 没解决问题的，差评
mysql 内连接，连续两次使用同一张表，自连接
Detco679: 好使好使

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。