CSV文件学习记录
一、读取CSV文件
1、标题
(1)用 read_csv()将数据从csv文件加载到Pandas数据框时,可以指定文件的哪一行作为标签,而标题指定了列标签。通常第一行是标签,但有时如果文件顶部有额外的元信息,我们希望指定另一行作为标题。如:
df = pd.read_csv('scores.csv', header=2)
df.head()
这里使用第3行作为标题,上面的所有数据都被删除。默认情况下,read_csv使用header=0,使用第一行作为列标签。
(2)如果文件中不包括列标签,可以使用header=None
防止数据的第一行被误当作列标签。
(3)自定义列标签:
labels = ['id', 'name', 'test']
df = pd.read_csv('scores.csv', names=labels)
df.head()
2、索引
除使用默认索引之外,还可以将一个或多个列指定为索引。如:
df = pd.read_csv('score.csv', index_col='name')
df.head()
二、写入CSV文件
用to_csv()写入csv文件时,默认保存索引,所以在将其写入新的csv文件后再次读取,会发现出现一个Unnamed:0
列标签。如需忽略索引,必须提供参数index=False
。