问题
你需要将一个Python对象序列化为一个字节流,以便将它保存到一个文件、存储到数据库或者通过网络传输它。
解决方案
对于序列化最普遍的做法就是使用 pickle 模块。为了将一个对象保存到一个文件中,可以这样做:
import pickle
data = ... # some python object
f = open('somefile', 'wb')
pickle.dump(data, f)
为了将一个对象转储为一个字符串, 可以使用pickle.dumps()
s = pickle.dumps(data)
为了从字节流中恢复一个对象,使用pickle.load()或pickle.loads()
# Restore from a file
f = open('somefile', 'rb')
data = pickle.load(f)
# restore from a string
data = pickle.loads(s)
如果你碰到某个库可以让你在数据库中保存/恢复Python对象或者是通过网络传输对象的话, 那么很有可能这个库的底层就使用了 pickle 模块。
pickle 是一种Python特有的自描述的数据编码。 通过自描述,被序列化后的数据包含每个对象开始和结束以及它的类型信息。 因此,你无需担心对象记录的定义,它总是能工作。 举个例子,如果要处理多个对象,你可以这样做:
>>> import pickle
>>> f = open('somedata', 'wb')
>>> pickle.dump([1, 2, 3, 4], f)
>>> pickle.dump('hello', f)
>>> pickle.dump({'Apple', 'Pear', 'Banana'}, f)
>>> f.close()
>>> f = open('somedata', 'rb')
>>> pickle.load(f)
[1, 2, 3, 4]
>>> pickle.load(f)
'hello'
>>> pickle.load(f)
{'Apple', 'Pear', 'Banana'}
>>>
你还能序列化函数,类,还有接口,但是结果数据仅仅将它们的名称编码成对应的代码对象