动手做一些学习记录:
pandas导入文件时遇到各种奇奇怪怪的问题,折腾了一晚上;
使用pd.read_csv()命令打开一个csv文件,解码时报错,对encoding进行修改,gb18030、gb2312、gbk解决文件中含有中文和特殊符号问题,path前加上r可解决文件路径中含特殊符号。
在使用pandas导入数据后,想对导入的数据按列操作的时候发现,只有1列。
结果显示1列
搜索教程发现,csv文件需要使用分隔符,添加命令sep = 's\+',讲道理应该不会有问题了,但是
结果还是1列。
在尝试了很多办法要后,发现。问题在pandas的列索引上,pandas默认将第0行作为索引,即为header = 0。
数据第0行只有1列:Fs:100Hz。因此添加sep = '\s+'没有起到预期效果。
如果将列索引改为header = 1,即为按照第一行对列进行索引。结果成功了。
此时如果将分隔符sep = '\s+'去掉,就又变成了1列
可见csv文件读取时,分隔符sep = '\s+'还是不能缺的。
总结:多列读取变1列,在路径,解码,分隔符都没有问题的情况下,检查数据并尝试对header进行修改。