1、数据csv文件存贮
1.1 CSV文件写入
CSV (Comma‐Separated Value, 逗号分隔值)
CSV是一种常见的文件格式,用来存储批量数据
np.savetxt(frame, array, fmt='%.18e', delimiter=None)
• frame : 文件、字符串或产生器,可以是.gz或.bz2的压缩文件
• array : 存入文件的数组
• fmt : 写入文件的格式,例如:%d %.2f %.18e
• delimiter : 分割字符串,默认是任何空格
import numpy as np a=np.arange(100).reshape((5,20)) np.savetxt('a.csv',a,fmt='%d',delimiter=',')
1 |
|
指定位置的保存文件
1 |
|
以上两种方法,指定位置的存放文件。原因是由于'\'具有转义符,改为‘/’或者前面加‘r’。
1.2 CSV文件读取
np.loadtxt(frame, dtype=np.float, delimiter=None, unpack=False)
• frame : 文件、字符串或产生器,可以是.gz或.bz2的压缩文件
• dtype : 数据类型,可选
• delimiter : 分割字符串,默认是任何空格
• unpack : 如果True,读入属性将分别写入不同变量
1 |
|
1 |
|
1.3 csv局限性
CSV只能有效存储一维和二维数组
np.savetxt() np.loadtxt()只能有效存取一维和二维数组
2、多维数据存取
(1)多维数据写入
a.tofile(frame, sep='', format='%s')
• frame : 文件、字符串
• sep : 数据分割字符串,如果是空串,写入文件为二进制
• format : 写入数据的格式
1 |
|
1 |
|
1 |
|
(2)读取多维数据
np.fromfile(frame, dtype=float, count=‐1, sep='')
• frame : 文件、字符串
• dtype : 读取的数据类型
• count : 读入元素个数,‐1表示读入整个文件
• sep : 数据分割字符串,如果是空串,写入文件为二进制
1 2 3 4 5 |
|
1 |
|
1 2 3 4 5 |
|
该方法需要读取时知道存入文件时数组的维度和元素类型
a.tofile()和np.fromfile()需要配合使用
可以通过元数据文件来存储额外信息
3、NumPy便捷文件存取
np.save(fname, array) 或 np.savez(fname, array)
• fname : 文件名,以.npy为扩展名,压缩扩展名为.npz
• array : 数组变量
np.load(fname)
• fname : 文件名,以.npy为扩展名,压缩扩展名为.npz
1 2 3 |
|
1 |
|
4、NumPy的随机数函数
NumPy的random子库
np.random.*
(1)
np.random.rand()
np.random.randn()
np.random.randint()
1 2 3 |
|
1 |
|
1 |
|
随机种子不变的话,随机数不变
(2)
(3)
5、NumPy的统计函数
NumPy直接提供的统计类函数
np.*
np.std() np.var() np.average()
(1)
(2)
6、NumPy的梯度函数