为了节省空间,您需要以二进制格式存储数据。这可以通过pickle模块实现。在
例如,让我们以二进制和文本格式保存1000个整数的列表:>>> from random import randint
>>> import pickle
>>> l = [randint(0, 100000) for i in range(0, 1000)]
>>> bf = open("out.bin", "wb") # binary file
>>> tf = open("out.txt", "w") # ASCII file
>>> pickle.dump(l, bf, -1) # write file with highest possible protocol (binary)
>>> for i in l:
... tf.write(str(i) + " ")
>>> bf.close()
>>> tf.close()
二进制文件的权重为3.7 kb,而文本文件的权重为5.8 kb:
^{pr2}$
如果您的目标是减小文件大小并用不同的语言(或不同的操作系统)读回文件,那么有许多解决方案比序列化为二进制格式更有效。你只是有一个文件压缩的问题。在python中,编写gzip压缩文件很容易,而从gzip压缩文件中读取是相当标准的,因此您应该在目标语言中找到适当的库。在
下面是如何将128*128*128列表写入gzip压缩文件:
^{3}$
这将产生一个5.5 Mb二进制文件,而不是由pickle生成的12 Mb未压缩文本文件和7.4 Mb二进制文件。在