解决UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xca in position 0: invalid continuation byte

💥💥💞💞欢迎来到本博客❤️❤️💥💥

🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。

⛳️座右铭:行百里者,半于九十。

📋📋📋本文目录如下:🎁🎁🎁

目录

💥1 概述

📚2 解决结果

🎉3 参考文献


💥1 概述

很棒的知识点回顾:UnicodeDecodeError—UTF-8 编码(Python 中的底层基础)

当出现:UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xca in position 0: invalid continuation byte,该怎么解决呢?

这个错误通常发生在尝试将非UTF-8编码的字节序列解码为UTF-8字符串时。解决这个问题的方法是指定正确的编码格式来解码字节序列。

你可以尝试以下几种方法来解决这个问题:

1. 指定正确的编码格式:你可以尝试使用其他编码格式来解码字节序列,例如'latin-1'或'gbk'。在使用open()函数打开文件时,可以指定encoding参数来指定编码格式,例如:`open('filename', encoding='latin-1')`。

2. 忽略错误的字节:你可以在解码时忽略错误的字节,通过指定errors参数为'ignore'。例如:`data.decode('utf-8', errors='ignore')`。

3. 使用正确的编码格式保存文件:如果你正在处理一个文件,确保将文件保存为正确的编码格式。在使用open()函数打开文件时,可以指定encoding和errors参数来指定编码格式和错误处理方式。

4. 检查字节序列的来源:如果你正在处理来自其他来源的字节序列,例如网络请求或其他文件,确保正确地处理和解码字节序列。

5.不加encoding默认编码方式采用utf-8,我的问题是因为cvs文件的表头带中文汉字,所以报错,我们国家汉字采用的编码方式是"gb2312",一般都是表头带汉字引起的,更改为如下代码就好了。

📚2 解决结果

以概述中第5点为例

将:

data = pd.read_csv(datafile,encoding = 'utf-8')

改为: 

data = pd.read_csv(datafile,encoding = 'gb2312')

🎉3 参考文献

文章中一些内容引自网络,会注明出处或引用为参考文献,难免有未尽之处,如有不妥,请随时联系删除。

  • 7
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

荔枝科研社

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值