1.两个主循环
genfromtxt运行两个主循环。第一个循环以字符串序列转换文件的每一行。第二个循环将每个字符串转换为适当的数据类型。这种机制比单循环慢,但具有更大的灵活性。特别是,当其他更快,更简单的功能(如loadtxt不能)无法处理时, genfromtxt能够考虑丢失的数据。
可识别文件:该功能可识别gzip和bz2(bzip2)存档
2.参数
numpy.
genfromtxt
( fname , dtype=<type 'float'> , comments='#' , delimiter=None , skip_header=0 , skip_footer=0 , converters=None , missing_values=None , filling_values=None , usecols=None , names=None , excludelist=None,deletechars=None,replace_space='_',autostrip=False,case_sensitive=True,defaultfmt='f%i',unpack=None,usemask=False,loose=True,invalid_raise=True , max_rows=None )[来源]
3.参数简介
fname : file, str, pathlib.Path, list of str, generator
dtype : dtype, 可选
comments :
用于指示注释开始的字符。注释后一行出现的所有字符都将被丢弃
delimiter :
定义分割应该如何发生
import numpy as np
from io import StringIO
s = StringIO("1,1.3,abcde")
data=np.genfromtxt(s,delimiter=',',dtype=[('myint','i8'),('myfloat','f8'),('mystring','S6')])
print(data)
skip_header :
要在文件开头跳过的行数。
skip_footer :
要在文件末尾跳过的行数。
converters:变量,可选
将列的数据转换为值的一组函数。转换器还可用于为缺失数据提供默认值:.
converters = {3: lambda s: float(s or 0)}
missing:变量,可选
在 numpy 1.10 中删除了missing。请改用missing_values 。
missing_values : 变量,可选
与缺失数据对应的字符串集。
fill_values : 变量,可选
数据丢失时用作默认值的一组值。
usecols : 序列,可选
要读取的列,0 是第一列。例如, 将提取第 2 列、第 5 列和第 6 列。
usecols = (1, 4, 5)
names:{无,真,str,序列},可选
如果names为 True,则从第一个skip_header行之后的第一个有效行读取字段名称。如果名称是逗号分隔名称的序列或单字符串,则名称将用于定义结构化 dtype 中的字段名称。如果名称为无,则将使用 dtype 字段的名称(如果有)。
excludelist : 序列,可选
要排除的名称列表。此列表附加到默认列表 ['return','file','print']。排除的名称会附加下划线:例如,file将变为file_。
deletechars : str, 可选
组合必须从名称中删除的无效字符的字符串。
defaultfmt : str, 可选
用于定义默认字段名称的格式,例如“f%i”或“f_%02i”。
autostrip : bool, 可选
是否自动从变量中去除空格。
replace_space : 字符,可选
用于替换变量名称中的空格的字符。默认情况下,使用“_”。
case_sensitive : {True, False, 'upper', 'lower'}, 可选
如果为 True,则字段名称区分大小写。如果为 False 或 'upper',字段名称将转换为大写。如果为 'lower',字段名称将转换为小写。
unpack:布尔,可选
如果为 True,则返回的数组被转置,以便可以使用解包参数
x, y, z = loadtxt(...)
usemask : bool, 可选
如果为 True,则返回一个掩码数组。如果为 False,则返回一个常规数组。
loose:布尔,可选
如果为 True,则不会为无效值引发错误。
invalid_raise :布尔,可选
如果为 True,如果在列数中检测到不一致,则会引发异常。如果为 False,则会发出警告并跳过违规行。
max_rows : int, 可选
要读取的最大行数。不得与skip_footer 同时使用。如果给定,该值必须至少为 1。默认是读取整个文件。
返回: | 出:ndarray
|
---|