CSV:逗号分隔值文件
显示:表格状态
源文件:换行和逗号分隔行列的格式化文本,每一行的数据表示一条记录
np.loadtxt
np.loadtxt(frame, dtype=np.float, delimiter=None, skiprows=0, usecols=None, unpack=False)
frame: 文件、字符串或产生器,可以是.gz或bz2压缩文件
dtype: 数据类型,可选,CSV的字符串以什么数据类型读入数组中,默认np.float
delimiter: 分隔字符串,默认是任何空格,改为逗号,比如csv文件就用逗号
skiprows: 跳过前x行,一般跳过第一行表头
usecols: 读取指定的列、索引、元组类型
unpack: 如果是True,读入属性将分别写入不同数组变量(相当于转置效果),False读入数据只写入一个数组变量,默认False
numpy的索引和切片
总结:
numpy索引和数据切片:
逗号前面取行,后面加:
逗号后面取列,前面加:
print(x[2]) # 取第3行
print(x[2:]) # 取第3行后面的行(包括第3行)
print(x[[0, 2]]) # 取不连续的多行(注意多加一个方括号)
print(x[:, 1]) # 取第2列
print(x[:, 2:]) # 取第2列后面的列
print(x[:, [0, 1, 2]]) # 取1,2,3列
print(x[3, 4]) # 取第三行第四列的值
print(x[2:4, 1:3]) # 取第3行到第5行,第2列到第4列
print(x[[0, 2], [0, 1]]) # 取多个不相邻的点
numpu中的数值修改
x[:, 2:4] = 12 # x数组中3到5行(不包括5行)的元素赋值为12
print(x < 10) # 将数组中所有的元素与10进行比较,小于10的为True,其他为false
x[x < 10] = 3 # 将数组中小于10的元素赋值为3
x = np.where(x < 10, 0, 10) # np三元运算符,x中小于10的元素赋值为0,大于等于10的元素赋值为10
x = x.clip(10, 18) # 把小于10的元素替换为10,大于18的元素替换为18