python导入数据文件报错:UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0x98 in position 16: invalid

做数据分析作业时,导入csv文件

import pandas as pd
test_df=pd.read_csv(r'D:\数据科学\实验二 数据统计分析\data2.csv')
print(test_df.head())

运行后报错:
在这里插入图片描述
即如题所述问题
首先看了下导入语法,贴个链接
https://www.cnblogs.com/OliverQin/p/8966321.html
语法写的应该没啥问题

然后看到了这篇文章:
https://blog.csdn.net/qq_35892623/article/details/82941473

解决方案
第一种:

第一行加:# -- coding: utf-8 --

第二种:

引用处设置默认编码格式

# coding: utf-8

第三种:

使用中文处将中文unicode编码

python3以后第二种方式。

按照博主的方法试了下 没有解决 并且出现了新的错误

UnicodeDecodeError: 'unicodeescape' codec can't decode bytes in position 5974-5975: truncated \UXXXXXXXX escape

新问题的网上的主要解决方案主要是修改路径写法
1.在字符串前加上r或R 我一开始就加上了
(注:其中r或R在python中表示一个不转义的字符串。)
2.将\改成双\
3.将\改成/

三种方法我都试过 情况仍然没有解决

最后!!还是问了一下同学,发现是把xslx文件改为csv文件的时候(直接修改的后缀名),没有选择UTF-8,所以相当于文件没有编码, 果然导入python打开看了下 是一堆乱码.

于是重新修改了文件:
在这里插入图片描述
选择UTF-8编码
然后直接复制到python文件夹下 使用相对路径打开
在这里插入图片描述

test_df=pd.read_csv('data2.csv')
print(test_df.head())

最后原来是自己犯了个低级错误 所以有时候和别人交流以下或许就豁然开朗了 另外附一个大神的博客 编码原理解释的很清晰。

https://blog.csdn.net/qq_18888869/article/details/82625343?spm=1001.2101.3001.6650.2&utm_medium=distribute.pc_relevant.none-task-blog-2%7Edefault%7ECTRLIST%7Edefault-2.no_search_link&depth_1-utm_source=distribute.pc_relevant.none-task-blog-2%7Edefault%7ECTRLIST%7Edefault-2.no_search_link

  • 3
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值