scrapy框架'utf-8' codec can't decode byte 0xd5 in position 248: invalid continuation byte

出现原因:我在利用我的爬虫去爬取某个网站时,突然爆出了这个错误。
可以。错误的大概以为为解码方式不对,不是utf-8,我之前爬其它的主流网站时都没爆出这个错误,但是我爬的报错网站是个老古董,个人感觉老古董网站的编码方式还真是让人无语。回到正题,解码方式基本就两种,不是utf-8,就是gbk两个任意选取。

在这里插入图片描述
解决:根据提示,找到G:\Python\Lib\site-packages\scrapy\robotstxt.py的这个文件。在第15行处将utf-8改为gbk即可。其它主流网站的爬取也不会受到影响(目前我爬取的主流网站还没有出现问题)。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值