Numpy可以在硬盘中将数据以文本二进制文件的形式存入硬盘或由硬盘载入。我们暂时只讨论numpy的内建二进制格式,因为大多数用户更倾向于使用pandas或其它工具来载入文本或表格型数据。数据分析是决离不开pandas的,关于pandas的知识内容,我会继续更新,更新之后附上跳转链接。
numpy数据存储和读取函数表
函数名 | 功能 |
---|---|
save | 将数组存入硬盘未压缩文件,默认文件后缀为.npy |
savez | 将多个数组存入硬盘未压缩文件,默认文件后缀为.npz |
savez_compressed | 将数组存入已经压缩的文件 |
load | 读入数组,文件中只有一个数组时,直接返回数组,有多个数组时,返回数组名和数组的字典 |
【例】数组存储示例
In [426]: arr = np.arange(10)
In [427]: np.save('some_array', arr)
In [428]: np.load('some_array.npy')
Out[428]: array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
In [429]: np.savez('array_archive.npz', a=arr, b=arr)
In [430]: arch = np.load('array_archive.npz')
In [432]: arch['b']
Out[432]: array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
In [433]: np.savez_compressed('arrays_compressed.npz', a=arr, b=arr)
In [434]: arch_com = np.load('arrays_compressed.npz')
In [436]: arch_com['b']
Out[436]: array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
注:数组在默认情况下是以未压缩的格式进行存储的,后缀名是.npy。
PS: 这篇文章是我写的numpy知识总结的一部分,完整知识总结入口在这篇文章,在这篇文章里我搭建了numpy的基础知识框架,非常适合入门。