python导入数据文件报错：UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0x98 in position 16: invalid

最新推荐文章于 2024-09-04 06:00:00 发布

lith__romantic

最新推荐文章于 2024-09-04 06:00:00 发布

阅读量2k

点赞数 3

分类专栏：数据分析文章标签： python 数据分析

本文链接：https://blog.csdn.net/m0_50707858/article/details/120902129

版权

在进行数据分析作业时，遇到Python导入CSV文件出现UnicodeDecodeError的问题。尝试了多种解决办法，如添加编码声明、修改路径写法等，但问题仍未解决。最终发现是因为CSV文件在改后缀名时未选择UTF-8编码导致文件无编码，重新用UTF-8编码保存文件后，问题得到解决。这个过程强调了与他人交流在解决问题中的重要性。

摘要由CSDN通过智能技术生成

做数据分析作业时，导入csv文件

import pandas as pd
test_df=pd.read_csv(r'D:\数据科学\实验二 数据统计分析\data2.csv')
print(test_df.head())

运行后报错：
在这里插入图片描述
即如题所述问题
首先看了下导入语法，贴个链接
https://www.cnblogs.com/OliverQin/p/8966321.html
语法写的应该没啥

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

lith__romantic

关注关注

3
点赞
踩
5

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd5 in position 2: invalid continuation byte-附件资源

03-02

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd5 in position 2: invalid continuation byte-附件资源

‘utf-8‘ codec can‘t decode byte 0xd4 in position 98: invalid continuation byte 报错解决方案

m0_52509348的博客

07-28

510

在运行以下代码读取文件时时发生报错，'utf-8' codec can't decode byte 0xd4 in position 98: invalid continuation byte 代码如下： import pandas as pd # 读csv文件 ds = pd.read_csv('nba.csv') print(ds.to_string()) 最终找到解决方案 ............

1 条评论您还未登录，请先登录后发表或查看评论

新手问题解决：UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0x84 in position 35: invalid start byte

2301_77474473的博客

02-25

1万+

作为一名python新手，运行程序真是如履薄冰，各种问题搞的头大。我只希望程序能够出图出误差结果，整好论文。运行程序一直出现UnicodeDecodeError: 'utf-8' codec can't decode byte 0x84 in position 35: invalid start byte意思是UnicodeDecodeError：“utf-8”编解码器无法解码位置 35 中的字节0x84：起始字节无效。

UnicodeDecodeError: ‘utf-8‘ Codec Can‘t Decode Byte 0x80 in Position 0**：UTF-8编码无法解码字节0x80的完美解决方法

最新发布

沉淀、分享、成长，让自己和他人都能有所收获！

09-04

8603

在未来的文章中，我将继续探讨Python编程中的常见错误与优化策略，帮助大家提高代码的健壮性和可读性。通常情况下，这个错误发生在处理非UTF-8编码的数据时，而你却使用了UTF-8解码器。本文将深入分析这个错误的成因，并提供有效的解决方案，以帮助你在处理文本数据时避免此类问题。通过阅读本篇文章，你将对字符编码有更深的理解，并能熟练应对与之相关的错误。是最常见的错误之一，尤其是在处理非UTF-8编码的数据时。通过这个函数，你可以将任何编码的文件转换为UTF-8，从而避免后续的编码问题。

python 导入数据错误：UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb5 in position 0: invalid start

qq_35892623的博客

10-05

22万+

正想导入数据到python作分析找到这个教程 https://www.cnblogs.com/OliverQin/p/8966321.html 我要导入CSV文件，已经放在相同目录之下。 import pandas as pd data = pd.read_csv("电信客户流失.csv",encoding="utf8") 报错如下 -----------------------...

‘utf-8‘ codec can‘t decode byte 0x80 in position 64: invalid start byte

xiejunna的博客

08-26

1万+

问题描述 python读取文件时，抛异常：'utf-8' codec can't decode byte 0x80 in position 64: invalid start byte 解决办法读取文件时，以二进制文件读取 # 正确 open(file=file_full_name, mode='rb') # 抛异常 open(file=file_full_name, mode='r') mode 参数源码释义： """ mode是一个可选字符串，用于指定文件的存储模式打开了。它默认为“r”，这意味着可

UnicodeDecodeError: 'utf-8' codec can't decode byte 0x82 in position 743: invalid start byte

提莫君的博客

03-20

2万+

代码： df_w = pd.read_table( r'C:\Users\lab\Desktop\web_list_n.txt', sep=',', header=None) 当我用pandas的read_table方法读取本地文件时，爆出这个错误: 　　UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xce in positi...

一种可能的原因：‘utf-8‘ codec can‘t decode byte 0x82 in position 16: invalid start byte错误

主攻电力电子和电力系统

11-24

7878

解决UnicodeDecodeError的一种可能的方法

报错"UnicodeDecodeError: 'utf-8' codec can't decode byte"的解决办法

qq_44987376的博客

11-25

6万+

在读取数据文件时发现报错：UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 原因：在程序中设定文件打开的编码格式为“utf-8”,但是在保存文件时却发现原文件的编码方式是“ANSI” 解决办法：打开文件，点击另存为在编码一栏选择UTF-8，保存 ...

‘utf-8‘ codec can‘t decode byte 0x.. in position .: invalid start byte

Xav Pun的博客

04-14

4万+

文章目录前言方法一方法二参考链接前言 python中，string和bytes互转的时候，经常会遇到这个问题。常用的解决方法有两种方法一在获取bytes的时候就指明使用的字符集。这里拿utf-8举例： with open('1.txt', 'r+', encoding='utf8') as f: content = f.read() 甚至是在写入的时候就指明字符集： with open('1.txt', 'w+', encoding='utf8') as f: f.write

basemap readshapefile UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb4 in position 0-附件资源

03-05

basemap readshapefile UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb4 in position 0-附件资源

解决pyshp UnicodeDecodeError的问题

12-23

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xcc in position 0: invalid continuation byte 这个是编解码的问题，解决方法是把版本降到1.2.12就可以了，虽然records里面的中文字段还需要再次解码，但...

UnicodeDecodeError: 'utf-8' codec can't decode byte 0x80 in position

CHENYAoo的博客

10-10

1万+

用python写的代码，大致是以下内容出错 import os # 使用os获取mypath文件夹内的文件 dir = os.listdir("mypath") # dir=[file1,file2,file3] for file in dir: with open(file,"rt") as f # “rt”表示以文本模式读取文件，默认是utf-8编码 # do...

Python3解决UnicodeDecodeError: 'utf-8' codec can't decode byte..问题终极解决方案

热门推荐

技术笔记

10-06

54万+

0x00 问题引出：最近在做一个买房自动化分析Python脚本，需要爬取网页。在使用urllib获取reqest的response的时候，还要进行编码转换。见语句： result = res.decode('utf-8') 当执行该语句的时候，会造成异常： UnicodeDecodeError: 'utf-8' codec can't decode byte 0x

UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte问题解决方案

sunwei0130的专栏

03-03

1万+

1.检查文件是否是utf-8编码，可以用notepad++，在左下角查看 2.l在decode里添加“ignore”参数，line.decode("utf-8", "ignore")， 3.中文将utf-8改成gbk

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb9 in position 16: invalid start byte

B1334628598的博客

04-30

2798

读取一个csv文件失败，提示： UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb9 in position 16: invalidstart byte 解决办法：使用Notepad++打开该csv文件，然后转为UTF-8编码 1 import csv 2 csv_reader=csv.reade...

python问题：UnicodeDecodeError: 'utf-8' codec can't decode byte in position : invalid start byte

weixin_38648232的博客

12-15

2万+

完成机器学习作业时，读取西瓜数据集的.csv文件，发现出现以上错误：UnicodeDecodeError: ‘utf-8’ codec can’t decode byte in position : invalid start byte 看过很多大佬的解决方案都不能搞定，其实问题就是在存在无法进行转换的二进制数据。追其根源，是因为编码方式。大家只需要修改文件编码方式为UTF-8即可。步骤：右键...

python 报错“UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte“的解决办法

GXQ的博客

04-27

4万+

参考：https://blog.csdn.net/weixin_40769885/article/details/82288553 UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xa1 in position 0: invalid start byte 后来经过不断查找终于找到了解决办法。由于我在程序中设定文件打开的编码格式为“utf-8”,但是我后来用电脑的记事本打开这个”三国演义.txt”文件，然后在点击另存为的时候，发现原文件的编码方式是“

pd.read_excel 报错：UnicodeDecodeError: 'utf-8' codec can't decode byte 0x84 in position 273: invalid start byte

08-06

遇到 `UnicodeDecodeError: 'utf-8' codec can't decode byte 0x84` 这样的错误，通常意味着Excel文件中的某些字符无法以UTF-8编码正确解析。解决这个问题的方法有几种： 1. **确认编码**: 检查Excel文件的原始编码。如果不是UTF-8，可以尝试使用正确的编码读取，如`cp1252`、`windows-1252`或`latin-1`。在`pandas`中，你可以这样做[^4]: ```python df = pd.read_excel('file.xlsx', encoding='encoding_name') ``` 2. **手动转换**: 如果知道特定部分的编码，可以选择性地对有问题的数据列进行转换[^5]: ```python problematic_column = df['column_name'].str.decode('original_encoding').encode('utf-8') df['column_name'] = problematic_column ``` 3. **预处理文件**: 使用专门的工具（如`openpyxl`或`xlrd`）来预先读取并转码文件，然后再传递给`read_excel`[^6]。 4. **使用错误处理**: 如果不能确定编码，可以设置`errors`参数为`'ignore'`，忽略错误，但可能丢失部分信息[^7]: ```python df = pd.read_excel('file.xlsx', encoding='utf-8', errors='ignore') ``` 5. **保存为其他格式**: 如果可能，考虑将Excel文件另存为支持UTF-8编码的格式，比如CSV，再重新导入[^8]。