机器学习数据导入方法总结

1、通过标准Python库导入CSV文件

        python提供了一个标准类库CSV,用来处理CSV文件。其中reader()函数用来读入CSV.

        

from csv import reader
import numpy as np
#使用标准的Python类库导入CSV文件
filename='iris.csv'
with open(filename, 'rt') as raw_materials:
    readers=reader(raw_marerials,delimiter=',')
    x=list(readers)
    data=np.array(x).astype('float')
    print (data.shape)

2、通过Numpy导入CSV文件

         使用Numpy的loadtxt()函数导入数据。使用这个函数处理的数据没有文件头,所有的数据结构(数据类型,例如:不能有的是float,有的是string)是一样的。

from numpy import loadtxt
filename='iris.csv'
with open(filename,'rt') as raw_data:
    data=loadtxt(raw_data,delimiter=',')
    print(data.shape)

3、通过Pandas导入CSV文件

通过pandas来导入csv文件要使用pandas.read_csv()函数。这个函数的返回值是DataFrame,可以方便的进行下一步的处理。这个函数名非常直观,便于代码的阅读和后续对数据的处理工作。在机器学习项目中,经常使用pandas来做数据的清洗和数据准备工作。

from pandas import read_csv
filename='iris.csv'
names=['separ-length','separ-width','petal-length','petal-width','class']
dataset=read_csv(filename,names=names)
print(dataset.shape)

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值