记录一下python读取文件
在做对比实验的过程当中,往往会遇到很多需要从.csv文件中读取数据的情况,因为做深度学习用的是python,所以下面记录一下使用python读取.csv文件的方法。
读取.csv文件,这里使用到了pandas库(一个数据处理很常用的库)。
import pandas as pd
testfilepath = "数据路径"
testfile = pd.read_csv(testfilepath + "文件名.csv", header=None, index_col=False)
# 后面的header和index_col可以看后续说明
使用pd.read_csv()即可读取.csv文件,读取出来的是一个dataframe类型的数据,对于pd.read_csv()的用法,可以参考这位博主的pd.read_csv用法
(关于index_col,在另一篇文章找到以下评论:
index_col: 可选值类型为int,sequence对象或者False, 默认为None 该参数指定csv中的一列作为每行的索引,如果指定了一个sequence对象,那么意味着该DataFrame使用了复合索引。 如果指定的文件是非对齐的并且在行的末尾有列分隔符(非对齐的:比如每行的单元格数目不一致),你必须显示声明index_col的值为False来告诉pandas不使用第一列作为索引。)
对于需要将dataframe类型的数据转换成array类型的,可以直接使用.values
testfile.values