python3 UnicodeDecodeError: 'utf-8' codec can't decode byte 0x8b in position 1: invalid start byte

最新推荐文章于 2025-04-14 17:08:01 发布

sunybole

最新推荐文章于 2025-04-14 17:08:01 发布

阅读量8.9k

点赞数 1

分类专栏： Python

本文链接：https://blog.csdn.net/sunybl/article/details/79815981

版权

Python 专栏收录该内容

12 篇文章

订阅专栏

Python3

代码：

from urllib.request import urlopen
from urllib.request import Request

url = "http://www.baidu.com"
ua_header = {"User-Agent":"Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; Trident/5.0;"}
#url作为Request（）方法的参数
request = Request(url, headers = ua_header)

#向指定的url发送请求
response = urlopen(request)

#类文件对象的支持 文件对象的操作方法
html = response.read()
#打印字符串
print(html.decode("utf8"))

报错：

UnicodeDecodeError: 'utf-8' codec can't decode byte 0x8b in position 1: invalid start byte

解决方案：

把

print(html.decode("utf8"))

改成

print(html.decode("utf8", errors="replace"))

虽然问题解决了但是，中间遇到一个问题，不是很明白,

第一次把

print(html.decode("utf8"))

改成

print(html.decode("utf8", errors="replace"))

完美解决报错问题，

（UnicodeDecodeError: 'utf-8' codec can't decode byte 0x8b in position 1: invalid start byte）

但是后面又写了几遍代码，写成

print(html.decode("utf8", errors="replace"))

有几次，会出现乱码问题，如果再改成

print(html.decode("utf8"))

之后，也不报错，也不乱码，两个问题完美都解决了。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

sunybole

关注关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
3
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xbe in position 0: invalid start byte

蓝多多的小仓库

11-03

1万+

报错： UnicodeDecodeError: 'utf-8' codec can't decode byte 0xbe in position 0: invalid start byte Unicode解码错误：'utf-8'编解码器无法解码位置0的字节0xbe：无效的启动方式解决方案1：将编码方式由'utf-8' 改为 'gb18030'，如下图所示：解决方案2：将.txt文件另存为，并编码方式改为 'utf-8' 编码，如下图所示，选择 UTF-8 即可。 ...

UnicodeDecodeError: utf-8 codec cant decode byte 0x8b in position 1: invalid start byte

qq_36380748的博客

05-15

2249

执行程序如下： from wsgiref.util import FileWrapper from django.http.response import HttpResponse wrapper= FileWrapper(open(file_path)) content_type = 'application/octet-stream' response = HttpResponse(wrapper, content_type) 会有下边的报错： Traceback (most rece.

3 条评论您还未登录，请先登录后发表或查看评论

Python3 解决 'utf-8' codec can't decode byte 0x8b in position 1: invalid start byte

BRAVE MAN的博客

11-23

6922

一、问题　　request.Request(url，headers=headerDict))的时候出现异常信息：'utf-8' codec can't decode byte 0x8b in position 1: invalid start byte 二、解决方案　　http头中headerDict参数："Accept-Encoding": "gzip, deflate", 　　代...

UnicodeDecodeError:'utf-8' codec can't decode byte 0x8b in position 1: invalid start byte

郑德帅

02-22

1万+

报错代码： UnicodeDecodeError:'utf-8' codec can't decode byte 0x8b in position 1: invalid start byte 报错原因： 1.编码转换间出了问题 2.出现异常报错是由于设置了decode()方法的第二个参数errors为严格（strict）形式造成的，因为默认就是这个参数，将其更改为 i...

UnicodeDecodeError: ‘utf-8‘ codec can‘t decode bytes in position 28-29: invalid continuation byte报错

最新发布

2302_80777118的博客

04-14

554

我的问题：文件路径有中文，修改为英文即可。

UnicodeDecodeError: 'utf-8' codec can't decode byte 0x8b in position 1: invalid start byte

zhang_cl_cn的博客

07-03

4万+

**由于标题有字符限制没有办法将主题说的更明白，就将错误信息贴了上去，望谅解** 场景：使用Python进行斗鱼直播页面的爬取，爬取的url：https://www.douyu.com/ 当使用str(爬取的html字节码,encoding='utf-8')进行一个编码转换的时候报UnicodeDecodeError: 'utf-8' codec can't decode byte 0x8b in...

python3 UnicodeDecodeError: 'utf-8' codec can't decode byte 0x8b in position 1: invalid start byte

chenlunju的专栏

01-31

5490

Python3 使用urllib库模拟请求头的错误。代码： import urllib.request url = 'http://www.baidu.com' # 模拟请求头 headers = { "User-Agent": "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chr...

UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0x8b in position 1: invalid start byte错误

m0_46458132的博客

12-13

1194

python爬取b站某视频时出现错误原因：没有解码解决：导入： from io import BytesIO import gzip 解码操作： h = response.read() buff = BytesIO(h) f = gzip.GzipFile(fileobj=buff) html = f.read().decode('utf-8')

UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0x80 in position 1: invalid start byte

Spicrab

09-07

2063

Error 用pandas读取一个csv文件时出现该错误： import pandas as pd df = pd.read_csv('filename', index_col=0) error message为UnicodeDecodeError: 'utf-8' codec can't decode byte 0x80 in position 1: invalid start byte. Solution 虽然在检查了该csv文件后未发现第一行文本有问题，但这个错误一定与utf-8无法解码文本有关。在

加载模型UnicodeDecodeError: utf-8 codec can t decode byte 0x8b in position 25: invalid start byte

05-25

模型文件可能不是UTF-8编码的，而是gzip或其他编码格式。尝试使用适当的解码器打开文件，例如在Python中使用gzip库： ```python import gzip with gzip.open('your_model_file.gz', 'rb') as f: model_data = f....

python 代码报错： UnicodeDecodeError: 'utf-8' codec can't decode byte 0x8b in position 1: invalid start byte

01-23

当遇到 `UnicodeDecodeError` 错误提示 `'utf-8' codec can't decode byte 0x8b in position 1: invalid start byte` 的时候，这通常意味着尝试用 UTF-8 编码解析的数据实际上是以其他形式编码的，比如 gzip 压缩过...

python爬虫UnicodeDecodeError: 'utf-8' codec can't decode byte 0x8b in position 1: invalid start byte

11-26

当爬虫爬取的网页内容包含非UTF-8编码格式的字符时，就会出现UnicodeDecodeError: 'utf-8' codec can't decode byte...的错误。解决方法如下： 1.在请求网页时指定编码格式，例如： ```python import requests ...

设置Accept-Encoding为gzip,deflate，返回的网页是乱码

热门推荐

mycar001的博客

10-30

4万+

用C#写代码去获取网页内容。其中request的header中，设置Accept-Encoding为gzip,deflate： req = (HttpWebRequest)WebRequest.Create(gSkydriveUrl); req.Headers.Add("Accept-Encoding", "gzip,deflate"); 结果始终返回是乱码：

解决 'utf-8' codec can't decode byte 0x8b in position 1: invalid start byte

liujingclan的专栏

04-24

1万+

最近在弄爬虫时老是发现这个错误，查了好久才发现是这一行出了问题 'Accept-Encoding':' gzip, deflate' 这条信息代表本地可以接收压缩格式的数据，而服务器在处理时就将大文件压缩再发回客户端，IE在接收完成后在本地对这个文件又进行了解压操作。出错的原因是因为你的程序没有解压这个文件，所以删掉这行就不会出现问题了。看来header不能随便复制过来啊

Python: 'utf-8' codec can't decode byte 0x8b in position 1: invalid start byte

七月与雪的博客

02-16

2224

‘utf-8’ codec can’t decode byte 0x8b in position 1: invalid start byte 起因：看小说无聊，想起用python自己写一个爬虫，爬出笔趣阁中的所有的小说。就去爬（www.xbiquge.la）网站。经过：代码如下 def getHtml(url): print('start html') #获取网页内容 ...

Python ‘utf-8‘ codec can‘t decode byte 0x8b in position 1: invalid start byte

卡尔特斯

11-13

2524

【代码】Python 'utf-8' codec can't decode byte 0x8b in position 1: invalid start byte。

Python 'utf-8' codec can't decode byte 0x8b in position 1: invalid start byte

卡尔特斯

11-13

853

案例一： ```py 使用 urllib import urllib.request 使用 json import json 定义 header headers = { # 'Accept': '/', # 因为有 Accept-Encoding 这行会报错：'utf-8' codec can't decode byte 0x8b in position 1: invalid ...

Python3解决UnicodeDecodeError:'utf-8' codec can't decode byte 0x8b in position 1: invalid start byte

Kingsley's Blog

06-17

1万+

有两种办法：这个时候可以选择修改字符集参数，一般这种情况出现得较多是在国标码(GBK)和utf8之间选择出现了问题。出现异常报错是由于设置了decode()方法的第二个参数errors为严格（strict）形式造成的，因为默认就是这个参数，将其更改为ignore等即可。例如: html.decode('utf8','ignore') ...