做数据分析作业时,导入csv文件
import pandas as pd
test_df=pd.read_csv(r'D:\数据科学\实验二 数据统计分析\data2.csv')
print(test_df.head())
运行后报错:
即如题所述问题
首先看了下导入语法,贴个链接
https://www.cnblogs.com/OliverQin/p/8966321.html
语法写的应该没啥问题
然后看到了这篇文章:
https://blog.csdn.net/qq_35892623/article/details/82941473
解决方案
第一种:
第一行加:# -- coding: utf-8 --
第二种:
引用处设置默认编码格式
# coding: utf-8
第三种:
使用中文处将中文unicode编码
python3以后第二种方式。
按照博主的方法试了下 没有解决 并且出现了新的错误
UnicodeDecodeError: 'unicodeescape' codec can't decode bytes in position 5974-5975: truncated \UXXXXXXXX escape
新问题的网上的主要解决方案主要是修改路径写法
1.在字符串前加上r或R 我一开始就加上了
(注:其中r或R在python中表示一个不转义的字符串。)
2.将\改成双\
3.将\改成/
三种方法我都试过 情况仍然没有解决
最后!!还是问了一下同学,发现是把xslx文件改为csv文件的时候(直接修改的后缀名),没有选择UTF-8,所以相当于文件没有编码, 果然导入python打开看了下 是一堆乱码.
于是重新修改了文件:
选择UTF-8编码
然后直接复制到python文件夹下 使用相对路径打开
test_df=pd.read_csv('data2.csv')
print(test_df.head())
最后原来是自己犯了个低级错误 所以有时候和别人交流以下或许就豁然开朗了 另外附一个大神的博客 编码原理解释的很清晰。