机器学习1.如何导入csv文件

最新推荐文章于 2024-05-15 10:30:30 发布

cainiaolaoliu

最新推荐文章于 2024-05-15 10:30:30 发布

阅读量1.4k

点赞数

分类专栏：机器学习文章标签： python numpy

本文链接：https://blog.csdn.net/fangshyv/article/details/128154272

版权

机器学习专栏收录该内容

2 篇文章 0 订阅

订阅专栏

一般导数csv文件有三种方法，这里仅介绍一种numpy里的loadtxt方法的方式

1.导包

import numpy as np

2.导入路径

path = "D:\downlond\iris_data.csv"

3.用loadtxt方法提取文件数据

data = np.loadtxt(path, dtype=float, delimiter=',', converters={4: iris_type})

这里注意，loadtxt里，第一个参数为路径，后边的参数均为默认参数的形式，每个参数都有其功能，使用的时候传相应的值即可，参数有下面这些：

def loadtxt(fname, dtype=float, comments='#', delimiter=None,
            converters=None, skiprows=0, usecols=None, unpack=False,
            ndmin=0, encoding='bytes', max_rows=None):

功能如下：

参数名	功能
fname	被读取的文件名（文件的相对地址或者绝对地址）
dtype	指定读取后数据的数据类型
comments	跳过文件中指定参数开头的行（即不读取）
delimiter	指定读取文件中数据的分割符
converters	对读取的数据进行预处理
skiprows	选择跳过的行数
usecols	指定需要读取的列
unpack	选择是否将数据进行向量输出
encoding	对读取的文件进行预编码

特别注意converters：
converters：该参数是将某一列的数据进行函数预处理再获取，格式为：{列号：函数}，可以看成一个字典形式，对列上的所有数据进行函数处理

converters处理案例：

converters={4: iris_type} #把第四列按照 iris_type的方式都处理了

def iris_type(s):
    it = {'setosa': 0, 'versicolor': 1 , b'virginica': 2}
    return it[s]
 #每一个传入的s，都会作为key值到it这个字典里，得到对应的value，也就是传入setosa会返回0

参数的详细内容见
https://blog.csdn.net/ACID_lv_ing/article/details/87092714