在jupyter中读取CSV文件时出现‘utf-8’ codec can’t decode byte 0xd5 in position 0: invalid continuation byte解决方法

最新推荐文章于 2025-03-17 09:49:48 发布

Moses·Zhen

最新推荐文章于 2025-03-17 09:49:48 发布

阅读量2w

点赞数 16

分类专栏： python 数据分析文章标签： pandas python 数据分析

本文链接：https://blog.csdn.net/weixin_44758458/article/details/89220989

版权

python 同时被 2 个专栏收录

7 篇文章

订阅专栏

数据分析

2 篇文章

订阅专栏

导入 import pandas as pd

使用pd.read_csv()读csv文件时，出现如下错误：

UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xd5 in position 0: invalid continuation byte

出现原因：CSV文件不是UTF-8进行编码，而是用gbk进行编码的。jupyter-notebook使用的Python解释器的系统编码默认使用UTF-8.

解决方式有两种;

第一种：

1.找到使用的csv文件--->鼠标右键--->打开方式---->选择记事本

2.打开文件选择“文件”----->"另存为“，我们可以看到默认编码是：ANSI，选择UTF-8重新保存一份，再使用pd.read_csv()打开就不会保存了

第二种：

使用pd.read()读取CSV文件时，进行编码

pd.read(filename,encoding='gbk')

比如：

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Moses·Zhen

关注关注

16
点赞
踩
39

收藏

觉得还不错? 一键收藏
8
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

'utf-8' codec can't decode byte 0xd5 in position 0: invalid continuation byte

jacke121的专栏

03-19

8158

pip install cupy时报错：site-packages\pip\compat\__init__.py 'utf-8' codec can't decode byte 0xd5 in position 0: invalid continuation byteD:\ProgramData\Miniconda3\envs\python3.6\Lib\site-packages\pip\com...

Pandas报错：‘utf-8‘ codec can‘t decode byte 0xe5 in position xxxx: invalid continuation byte

Python进阶专栏《爬虫实战进阶》，《Pyppeteer从入门到精通》原创作者

04-03

3110

本文是该专栏的第28篇，后面会持续分享python的数据分析知识，记得关注。遇到上述报错，需要怎么解决？跟着笔者往下看正确的解决方法。运行上述代码，会报上面的错误信息。遇到该情况，只需要一行代码即可解决。

8 条评论您还未登录，请先登录后发表或查看评论

UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xd6 in position 11: invalid continuation byte

m0_56522868的博客

01-04

1387

问题：在使用pandas的时候，读取excel保存的数据的时候会出现下面的报错原因：其实很简单，就是excel默认保存的就是ansi的保存的，但是python默认打开的是utf-8编码的怎么确定是不是自己的文件的编码的问题？只要你打开txt记事本就能确定该文件是不是utf-8的，可以看到，很显然我这个文件不是的解决：网上搜了一下，发现很多复杂的做法，又是让转码，又是让重新保存，真的浪费了很多时间，所以记录一下，避免各位走不必要的弯路。办法如下：其实什么都不用做，直

UnicodeDecodeError: ‘utf-8‘ codec can‘t decode bytes in position 1022-1023: unexpected

最新发布

Leon_Jinhai_Sun的博客

03-17

634

错误原因：数据不完整或编码不正确，导致UTF-8解码失败。解决方法确保数据完整。使用正确的编码解码。捕获异常并调试。优化代码：在PDF解析和API请求中增加异常处理，确保数据正确解码。

讲解‘utf-8‘ codec can‘t decode byte 0xd5 in position 0: invalid continuation byte

牛肉胡辣汤

12-26

1505

GB2312编码和UTF-8编码都是常见的字符编码方式，用于将文本中的字符转换成二进制数据以便于存储和传输。这个错误通常表示在解码字节序列时出现了问题，可能是由于不正确的字符编码或存在非法字节序列导致的。然后，尝试使用utf-8进行解码，如果出现解码错误，则尝试使用其他编码方式，如gbk、latin-1等。具体的方法取决于数据的特点和您的需求，可以考虑使用正则表达式、替换非法字节等方法来清理数据。如果您知道原始数据是以不同的字符编码保存的，您可以尝试将正确的字符编码传递给相关的解码函数。

UnicodeDecodeError:‘utf-8‘codec can‘t decode byte 0xd5 in position 0:invalid continuation byte

py豆腐的博客

05-06

3874

UnicodeDecodeError:'utf-8'codec can't decode byte 0xd5 in position 0:invalid continuation byte

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd5 in position 0: invalid continuation byte

baoFeng_Li的博客

03-29

2万+

前言：在我使用pandas模块对csv文件读取时报错： UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd5 in position 0: invalid continuation byte 在查找资料后，发现大部分都不怎么适用，所以在这里做个记录。如果你在读取文件时（csv,table等等）出现类似错误，可以参照如下。分...

UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xd5 in position 0: invalid continuation byte

weixin_42052249的博客

10-08

1527

读取csv文件时，程序报错：“UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd5 in position 0: invalid continuation byte”

read_csv()报错: 'utf-8' codec can't decode byte 0xca in position 0: invalid continuation byte最新解决办法

wj的博客

07-15

1万+

pandas read_csv()读取csv文件报错：UnicodeDecodeError: 'utf-8' codec can't decode byte 0xca in position 0: invalid continuation byte，用office软件或vscode即可解决

使用Bert分割语料集报错UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xd4 in position 5: invalid continu

qq_42041648的博客

04-09

1447

最近使用bert模型进行情感分析，参考别人的文章首先是要划分训练集、测试集、开发集。但是在读取数据集的过程中一直报错UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xd4 in position 5: invalid continuation byte。故在网上查找解决方案，看到帖子说转为utf-8码时超出了范围，gbk编码方式范围更广，所以在读取csv文件时加入encoding=‘gbk’. pd_all = pd.read_csv(os.path

解决SyntaxError: (unicode error) ‘utf-8‘ codec can‘t decode byte 0xca in position 4: invalid

Darren洋的博客

07-31

5192

解决SyntaxError: (unicode error) 'utf-8' codec can't decode byte 0xca in position 4: invalid

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd5 in position 2: invalid continuation byte-附件资源

03-02

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd5 in position 2: invalid continuation byte-附件资源

UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xd5 in position 0: invalid continuation byte

qq_45860901的博客

10-13

3207

使用 import pandas as pd 使用pd.read_csv()读csv文件时，出现如下错误： UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xd5 in position 0: invalid continuation byte第一种（不行）：显式设置各种编码方式，都不行，包括gbk，ANSI，ISO啥的第二种（不行）：设置为unicode_escape,不行，会报出另一个错误第三种（可行）：将csv文件的编码方式改为 utf

Python3错误：UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd5 解决方法

热门推荐

polyhedronx的博客

08-23

16万+

在解决一个实时获取命令行输出的问题时，通过查找资料，发现一个从subprocess运行的子进程中实时获取输出的方法，程序如下： import shlex import subprocess if __name__ == '__main__': shell_cmd = 'ping www.baidu.com' cmd = shlex.split(shell_cmd) p = subpro...

pandas读csv出现 'utf-8' codec can't decode byte 0xd5 in position 0: invalid continuation byte

kylinxjd的博客

08-07

2235

在使用Pandas读取csv文件的时候，很可能出现编码不对的情况。这时候可以指定读取编码解决。

'utf-8' codec can't decode byte 0xd5 in position XXX: invalid continuation byte问题

weixin_30342827的博客

10-17

2293

　　找了一下午，各种资料搜集，愣是没搜出来答案。结果今天早上，做一个小小的改变，就整出来了。。。步骤如下： 1、打开excel，全选数据 2、新建记事本，粘贴，选择脚本，更改字体： 3、新建Excel表格，粘贴回去，就OK了。折腾了一下午啊，有没有？本来还打算直接从数据库中读取的。。。参考帖子附上：用python3读csv文件，出现UnicodeDecodeErr...

出现‘utf-8‘ codec can‘t decode byte 0xd5 in position 0: invalid continuation byte读取csv失败

weixin_43100196的博客

10-20

1983

1、python读取csv文件出现无效字节，解码失败问题这个时候往往是csv文件中包含有汉字的问题，这时候只需要在pd.read_csv( )加入enconding=‘gbk’去解码csv文件，然后就可以了。其他解码方式还有**‘utf-8’**等解码方式。 ...

python37读txt,csv文件报错：UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd5 in position 0:

dongmeianna的博客

03-13

6289

环境说明：编辑器pycharm，python37，win7 1、读txt文件代码： file1 = open(r'C:\Users\Administrator\Desktop\test\abc.txt','r',encoding='utf-8') filecontent= file1.read() print(filecontent) 运行报错信息： UnicodeDecode...

utf-8 codec can t decode byte 0xd4 in position 28: invalid continuation byte

09-13

这个错误是由于编码问题引起的。具体来说，Python试图将字节流解码为UTF-8编码的字符时出现了错误。错误消息中的"0xd4"表示字节流中的一个字节，它在指定的位置28处无法正确解码为有效的续行字节。为了解决这个问题，你可以尝试以下方法： 1. 使用正确的编码进行解码：检查你正在使用的编码是否正确。你可以尝试使用其他编码，如ISO-8859-1或GBK来解码字节流，看看是否能够成功。 2. 修改文件的编码：如果你有权访问原始文件并且文件的编码确实不是UTF-8，你可以尝试将文件的编码更改为UTF-8。你可以使用记事本或其他文本编辑器打开文件，并将其另存为UTF-8编码。然后，尝试使用Pandas读取修改后的文件。 3. 批量处理多个CSV文件：如果你需要处理多个CSV文件或文件非常大，手动更改编码可能不切实际。在这种情况下，你可以编写Python脚本来自动处理批量文件。你可以使用Python的文件处理和编码库来读取每个文件，并将其另存为UTF-8编码。然后，使用Pandas读取修改后的文件。总结起来，这个错误是由于文件的编码问题导致的。你可以尝试使用不同的编码进行解码，或者将文件的编码更改为UTF-8。如果你需要批量处理多个文件，可以编写Python脚本来自动处理。希望这些方法能够帮助你解决这个问题。