import pandas as pd
读取CSV文件
csv文件以.csv后缀结尾,默认用’,’作为分隔符,pandas提供了pd.read_csv()函数供我们读取csv文件:
pd.read_csv(filepath_or_buffer, sep=’,’, delimiter=None, header=’infer’, names=None, index_col=None, usecols=None, squeeze=False, converters=None, true_values=None, false_values=None, skiprows=None, nrows=None, na_values=None)
常用参数解释:
filepath_or_buffer:文件名、文件具体或相对路径、文件对象
usecols:保留指定列
sep、delimiter:俩者均为文件分割符号,或为正则表达式
header:当文件中无列名需将其设为None
names:结合header=None,读取时传入列名
skiprows:忽略特定的行数
nrows:读取一定行数
na_values:一组将其值转换为NaN的特定值
sueeze:返回Series对象
1 保留指定列
pd.read_csv('test.csv',usecols=[0,2])
代码结果:
k1 | values1 | |
---|---|---|
0 | a | 1 |
1 | a | 8 |
2 | b | 3 |
3 | c | 2 |
2 读取无列名的csv文件
若csv文件没有列名,则需要自行输入列名,否则Pandas会自动添加列名。
pd.read_csv('test2.csv',header=None,names=['k1','k2','value1','value2'])
代码结果:
k1 | k2 | value1 | value2 | |
---|---|---|---|---|
0 | a | x | 1 | 2 |
1 | a | y | 8 | 3 |
2 | b | y | 3 | 3 |
3 | c | z |