Numpy函数笔记——np.genfromtxt（）

最新推荐文章于 2024-05-23 20:14:27 发布

weixin_54096215

最新推荐文章于 2024-05-23 20:14:27 发布

阅读量1k

点赞数

分类专栏： Numpy函数笔记文章标签： python

本文链接：https://blog.csdn.net/weixin_54096215/article/details/120652524

版权

Numpy函数笔记专栏收录该内容

4 篇文章 0 订阅

订阅专栏

1.两个主循环

genfromtxt运行两个主循环。第一个循环以字符串序列转换文件的每一行。第二个循环将每个字符串转换为适当的数据类型。这种机制比单循环慢，但具有更大的灵活性。特别是，当其他更快，更简单的功能（如loadtxt不能）无法处理时， genfromtxt能够考虑丢失的数据。

可识别文件:该功能可识别gzip和bz2（bzip2）存档

2.参数

numpy.genfromtxt( fname , dtype=<type 'float'> , comments='#' , delimiter=None , skip_header=0 , skip_footer=0 , converters=None , missing_values=None , filling_values=None , usecols=None , names=None , excludelist=None，deletechars=None，replace_space='_'，autostrip=False，case_sensitive=True，defaultfmt='f%i'，unpack=None，usemask=False，loose=True，invalid_raise=True , max_rows=None )[来源]

3.参数简介

fname : file, str, pathlib.Path, list of str, generator

dtype : dtype, 可选

comments :

用于指示注释开始的字符。注释后一行出现的所有字符都将被丢弃

delimiter :

定义分割应该如何发生

import numpy as np
from io import StringIO
s = StringIO("1,1.3,abcde")
data=np.genfromtxt(s,delimiter=',',dtype=[('myint','i8'),('myfloat','f8'),('mystring','S6')])
print(data)

skip_header :

要在文件开头跳过的行数。

skip_footer :

要在文件末尾跳过的行数。

converters：变量，可选

将列的数据转换为值的一组函数。转换器还可用于为缺失数据提供默认值：.converters = {3: lambda s: float(s or 0)}

missing：变量，可选

在 numpy 1.10 中删除了missing。请改用missing_values 。

missing_values : 变量，可选

与缺失数据对应的字符串集。

fill_values : 变量，可选

数据丢失时用作默认值的一组值。

usecols : 序列，可选

要读取的列，0 是第一列。例如，将提取第 2 列、第 5 列和第 6 列。usecols = (1, 4, 5)

names：{无，真，str，序列}，可选

如果names为 True，则从第一个skip_header行之后的第一个有效行读取字段名称。如果名称是逗号分隔名称的序列或单字符串，则名称将用于定义结构化 dtype 中的字段名称。如果名称为无，则将使用 dtype 字段的名称（如果有）。

excludelist : 序列，可选

要排除的名称列表。此列表附加到默认列表 ['return','file','print']。排除的名称会附加下划线：例如，file将变为file_。

deletechars : str, 可选

组合必须从名称中删除的无效字符的字符串。

defaultfmt : str, 可选

用于定义默认字段名称的格式，例如“f%i”或“f_%02i”。

autostrip : bool, 可选

是否自动从变量中去除空格。

replace_space : 字符，可选

用于替换变量名称中的空格的字符。默认情况下，使用“_”。

case_sensitive : {True, False, 'upper', 'lower'}, 可选

如果为 True，则字段名称区分大小写。如果为 False 或 'upper'，字段名称将转换为大写。如果为 'lower'，字段名称将转换为小写。

unpack：布尔，可选

如果为 True，则返回的数组被转置，以便可以使用解包参数 x, y, z = loadtxt(...)

usemask : bool, 可选

如果为 True，则返回一个掩码数组。如果为 False，则返回一个常规数组。

loose：布尔，可选

如果为 True，则不会为无效值引发错误。

invalid_raise ：布尔，可选

如果为 True，如果在列数中检测到不一致，则会引发异常。如果为 False，则会发出警告并跳过违规行。

max_rows : int, 可选

要读取的最大行数。不得与skip_footer 同时使用。如果给定，该值必须至少为 1。默认是读取整个文件。

返回：	出：ndarray 从文本文件中读取的数据。如果usemask为 True，则这是一个掩码数组。

weixin_54096215

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Numpy函数笔记——np.genfromtxt（）

1.两个主循环genfromtxt运行两个主循环。第一个循环以字符串序列转换文件的每一行。第二个循环将每个字符串转换为适当的数据类型。这种机制比单循环慢，但具有更大的灵活性。特别是，当其他更快，更简单的功能（如loadtxt不能）无法处理时，genfromtxt能够考虑丢失的数据。可识别文件:该功能可识别gzip和bz2（bzip2）存档2.参数numpy.genfromtxt(fname,dtype=<type 'float'>,comments='#',...
复制链接

扫一扫