💥💥💞💞欢迎来到本博客❤️❤️💥💥
🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。
⛳️座右铭:行百里者,半于九十。
📋📋📋本文目录如下:🎁🎁🎁
目录
💥1 概述
很棒的知识点回顾:UnicodeDecodeError—UTF-8 编码(Python 中的底层基础)
当出现:UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xca in position 0: invalid continuation byte,该怎么解决呢?
这个错误通常发生在尝试将非UTF-8编码的字节序列解码为UTF-8字符串时。解决这个问题的方法是指定正确的编码格式来解码字节序列。
你可以尝试以下几种方法来解决这个问题:
1. 指定正确的编码格式:你可以尝试使用其他编码格式来解码字节序列,例如'latin-1'或'gbk'。在使用open()函数打开文件时,可以指定encoding参数来指定编码格式,例如:`open('filename', encoding='latin-1')`。
2. 忽略错误的字节:你可以在解码时忽略错误的字节,通过指定errors参数为'ignore'。例如:`data.decode('utf-8', errors='ignore')`。
3. 使用正确的编码格式保存文件:如果你正在处理一个文件,确保将文件保存为正确的编码格式。在使用open()函数打开文件时,可以指定encoding和errors参数来指定编码格式和错误处理方式。
4. 检查字节序列的来源:如果你正在处理来自其他来源的字节序列,例如网络请求或其他文件,确保正确地处理和解码字节序列。
5.不加encoding默认编码方式采用utf-8,我的问题是因为cvs文件的表头带中文汉字,所以报错,我们国家汉字采用的编码方式是"gb2312",一般都是表头带汉字引起的,更改为如下代码就好了。
📚2 解决结果
以概述中第5点为例
将:
data = pd.read_csv(datafile,encoding = 'utf-8')
改为:
data = pd.read_csv(datafile,encoding = 'gb2312')
🎉3 参考文献
文章中一些内容引自网络,会注明出处或引用为参考文献,难免有未尽之处,如有不妥,请随时联系删除。