scrapy框架'utf-8' codec can't decode byte 0xd5 in position 248: invalid continuation byte

最新推荐文章于 2024-06-21 10:51:21 发布

清风怜明月

最新推荐文章于 2024-06-21 10:51:21 发布

阅读量1k

点赞数

分类专栏：学习笔记记录文章标签： python爬虫 scrapy crawlspider

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_43671933/article/details/102878139

版权

学习笔记记录专栏收录该内容

15 篇文章 0 订阅

订阅专栏

出现原因：我在利用我的爬虫去爬取某个网站时，突然爆出了这个错误。
可以。错误的大概以为为解码方式不对，不是utf-8，我之前爬其它的主流网站时都没爆出这个错误，但是我爬的报错网站是个老古董，个人感觉老古董网站的编码方式还真是让人无语。回到正题，解码方式基本就两种，不是utf-8,就是gbk两个任意选取。

在这里插入图片描述
解决：根据提示，找到G:\Python\Lib\site-packages\scrapy\robotstxt.py的这个文件。在第15行处将utf-8改为gbk即可。其它主流网站的爬取也不会受到影响（目前我爬取的主流网站还没有出现问题）。

清风怜明月

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
scrapy框架'utf-8' codec can't decode byte 0xd5 in position 248: invalid continuation byte

出现原因：我在利用我的爬虫去爬取某个网站时，突然爆出了这个错误。可以。错误的大概以为为解码方式不对，不是utf-8，我之前爬其它的主流网站时都没爆出这个错误，但是我爬的报错网站是个老古董，个人感觉老古董网站的编码方式还真是让人无语。回到正题，解码方式基本就两种，不是utf-8,就是gbk两个任意选取。解决：根据提示，找到G:\Python\Lib\site-packages\scrapy\r...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。