爬虫编码问题 'gbk' codec can't encode character '\xa0' in position 1816: illegal multibyte sequence

最新推荐文章于 2023-03-28 09:37:34 发布

进程击序的媛

最新推荐文章于 2023-03-28 09:37:34 发布

阅读量1.9k

点赞数 4

分类专栏：毕业设计

本文链接：https://blog.csdn.net/qq_25974431/article/details/80141809

版权

4 篇文章 0 订阅

订阅专栏

def parse_url(self, response):
    print(remove_tags(response.selector.xpath('//body').extract()[0]))

在我用该函数解析爬取到的信息response时候，发现有异常，报错为

UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position 1816: illegal multibyte sequence

通过百度,发现是控制台的输出编码格式为gbk，所以添加一段代码就行

import io
import sys

#改变标准输出的默认编码
sys.stdout = io.TextIOWrapper(sys.stdout.buffer,encoding='gb18030')

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注