1.在执行之前写的Python3爬虫代码时,出现
‘gbk’ codec can’t decode byte 0x8b in position 1: illegal multibyte sequence的错误。
使用utf、gb2312、gb18030都不行。
原代码:
***
address="…"
response=urllib.request(address).read()
message=response.decode(‘gbk’)
****
2.原因是由于网站升级,使用了新的编码压缩方式gzip。所以需要先解压缩,再做解码。
***
import gzip
address="…"
response=urllib.request(address).read()
message=gzip.decompress(response).decode(‘gbk’)
****
'gbk' codec can't decode byte 0x8b in position 1: illegal multibyte sequence
最新推荐文章于 2023-09-26 09:53:14 发布