Scrapy框架爬取时，UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb1 in position解决方法

最新推荐文章于 2024-07-07 13:17:53 发布

Last_xuan1

最新推荐文章于 2024-07-07 13:17:53 发布

阅读量1.1w

点赞数

分类专栏： # 基础知识&错误文章标签：解决方法 scrapy

本文链接：https://blog.csdn.net/qq_43391383/article/details/87295515

版权

基础知识&错误专栏收录该内容

7 篇文章 1 订阅

订阅专栏

编码嘛，不是utf8就是gbk
这里贴上代码

import demjson
start_urls = ['https://pic.sogou.com/pics/channel/getAllRecomPicByTag.jsp?category=壁纸&tag=全部&start=0&len=15']

    def parse(self, response):
        content = demjson.decode(response.body.decode('gbk'))# 这样就可以了

首先要管理员身份运行cmd，pip安装一下更强大的json解析库demjson

pip install demjson

然后对要提取的内容进行gbk的解码在用demjson.decode()解析获得python对象的json数据

content = demjson.decode(response.body.decode(‘gbk’))

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Last_xuan1

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Scrapy框架爬取时，UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb1 in position解决方法

编码嘛，不是utf8就是gbk这里贴上代码import demjsonstart_urls = ['https://pic.sogou.com/pics/channel/getAllRecomPicByTag.jsp?category=壁纸&amp;tag=全部&amp;start=0&amp;len=15'] def parse(self, response): ...
复制链接

扫一扫