1、通过标准Python库导入CSV文件
python提供了一个标准类库CSV,用来处理CSV文件。其中reader()函数用来读入CSV.
from csv import reader
import numpy as np
#使用标准的Python类库导入CSV文件
filename='iris.csv'
with open(filename, 'rt') as raw_materials:
readers=reader(raw_marerials,delimiter=',')
x=list(readers)
data=np.array(x).astype('float')
print (data.shape)
2、通过Numpy导入CSV文件
使用Numpy的loadtxt()函数导入数据。使用这个函数处理的数据没有文件头,所有的数据结构(数据类型,例如:不能有的是float,有的是string)是一样的。
from numpy import loadtxt
filename='iris.csv'
with open(filename,'rt') as raw_data:
data=loadtxt(raw_data,delimiter=',')
print(data.shape)
3、通过Pandas导入CSV文件
通过pandas来导入csv文件要使用pandas.read_csv()函数。这个函数的返回值是DataFrame,可以方便的进行下一步的处理。这个函数名非常直观,便于代码的阅读和后续对数据的处理工作。在机器学习项目中,经常使用pandas来做数据的清洗和数据准备工作。
from pandas import read_csv
filename='iris.csv'
names=['separ-length','separ-width','petal-length','petal-width','class']
dataset=read_csv(filename,names=names)
print(dataset.shape)