主要介绍python中导入csv格式数据的三种方法:
1.采用标准Python类库导入数据
2.采用Numpy导入数据
3.采用Pandas导入数据
数据导入
1.采用标准Python类库导入数据
Python提供了一个标准类库CSV,用来处理CSV文件。这个类库中的reader()函数用来读
入CSV文件
from csv import reader
import numpy as np
#使用标准的Python类库导入csv数据
filename = 'pima_data.csv'
with open(filename,'rt') as raw_data:
readers = reader(raw_data,delimiter=',')
x = list(readers)
data = np.array(x).astype('float')
print(data.shape)
2.采用NumPy导入数据
也可以使用Numpy的loadtxt()函数导入数据。使用这个函数处理的数据没有文件头,并且所有的数据结构是一样的,也就是说,数据类型是一样的。代码如下:
from numpy import loadtxt
#使用NumPy导入csv数据
filename = 'pima_data.csv'
with open(filename,'rt') as raw_data:
data = loadtxt(raw_data,delimiter=',')
print(data.shape)
3.采用Pandas导入数据
通过Pandas来导入csv文件要使用pandas.read_csv()函数.这个函数的返回值是DataFrame,可以很方便的进行下一步处理。
from pandas import read_csv
#使用Pandas导入csv数据
filename = 'pima_data.csv'
names = ['preg','plas','pres','skin','test','mass','pedi','age','class']
data = read_csv(filename,names = names)
print(data.shape)
上面就是导入csv数据的三种方法,绝大多数时候应该是可以跑通的,我在例子中用的是
机器学习印第安人糖尿病的数据集,大家可以灵活自由更换,填写csv文件地址就可以了,感谢观看。