一.数据的CSV文件存取
1、将数据写入CSV文件
np.savetxt(frame, array, fmt='%.18e', delimiter=None)
• frame : 文件、字符串或产生器,可以是.gz或.bz2的压缩文件
• array : 存入文件的数组
• fmt : 写入文件的格式,例如:%d %.2f %.18e
• delimiter : 分割字符串,默认是任何空格
import numpy as np
a = np.arange(100).reshape(5, 20)
np.savetxt('a.csv', a, fmt='%d', delimiter=',')
根目录下会生成以下文件。
import numpy as np
a = np.arange(100).reshape(5, 20)
np.savetxt('a.csv', a, fmt='%.1f', delimiter=',')
将fmt的参数改为 %.1f 后,生成的文件就会变为浮点数。
2、读取CSV文件数据
np.loadtxt(frame, dtype=np.float, delimiter=None, unpack=False)
• frame : 文件、字符串或产生器,可以是.gz或.bz2的压缩文件
• dtype : 数据类型,可选
• delimiter : 分割字符串,默认是任何空格
• unpack : 如果True,读入属性将分别写入不同变量
b = np.loadtxt('a.csv', delimiter=',')
b
直接用loadtxt读取文件的话,原先的CSV文件是什么格式,读取 出来的内容就会是什么格式。
加入dtype参数后,就会变为指定的格式。
二、多维数据存取
1、存数据
a.tofile(frame, sep='', format='%s')
• frame : 文件、字符串
• sep : 数据分割字符串,如果是空串,写入文件为二进制
• format : 写入数据的格式
import numpy as np
a = np.arange(100).reshape(5, 20)
a.tofile('b.dat', sep=',', format='%d')
不加入 sep 便会变为二进制
2、取数据
np.fromfile(frame, dtype=float, count=‐1, sep='')
• frame : 文件、字符串
• dtype : 读取的数据类型
• count : 读入元素个数,‐1表示读入整个文件
• sep : 数据分割字符串,如果是空串,写入文件为二进制
import numpy as np
a = np.arange(100).reshape(5, 10, 2)
a.tofile("b.dat", sep=',', format="%d")
c = np.fromfile("b.dat", dtype=np.int, sep=',').reshape(5, 10, 2)
c
import numpy as np
a = np.arange(100).reshape(5, 10, 2)
a.tofile("b.dat"', format="%d")
c = np.fromfile("b.dat", dtype=np.int).reshape(5, 10, 2)
c
写入的是一个二进制文件,读取也用二进制的方式读取。
需要注意的是,在使用这个方法读取时,
需要知道存入文件时数组的维度和元素类型
a.tofile() 和np.fromfile()需要配合使用
可以通过元数据文件来存储额外信息
3、Numpy便捷方式存储
用numpy自定义的方式来存取。
np.save(fname, array) 或 np.savez(fname, array)
• fname : 文件名,以.npy为扩展名,压缩扩展名为.npz
• array : 数组变量
np.load(fname)
• fname : 文件名,以.npy为扩展名,压缩扩展名为.npz