UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xed in position 15338: invalid continuation byte 或 ‘gbk’ codec can’t decode byte 0xd6 in position 4814: illegal multibyte sequence 的解决方法
一、如果返回值没问题,可以直接在爬虫代码后面加 ignore,忽略掉错误。
text = resp.content.decode(“utf-8”,“ignore”)
text = resp.content.decode(“gdk”,“ignore”)
二、有可能是文字编码的解码方法不对
参考我的上一篇博客:
爬取返回值为【】的解决方法:采取正确的文字解码【爬虫笔记】