这是关于序列化和反序列化Python对象的教程的第二部分。 在第一部分中 ,您学习了基础知识,然后深入研究Pickle和JSON的来龙去脉。
在这一部分中,您将探索YAML(确保拥有第1部分中正在运行的示例),讨论性能和安全性考虑,对其他序列化格式进行审查,最后学习如何选择正确的方案。
YAML
YAML是我最喜欢的格式。 这是一种人类友好的数据序列化格式。 与Pickle和JSON不同,它不是Python标准库的一部分,因此您需要安装它:
pip install yaml
yaml模块仅具有load()
和dump()
函数。 默认情况下,它们使用loads()
和dumps()
类的字符串,但是可以使用第二个参数,它是一个开放流,然后可以转储文件或从文件中加载。
import yaml
print yaml.dump(simple)
boolean: true
int_list: [1, 2, 3]
none: null
number: 3.44
text: string
请注意,YAML与Pickle甚至JSON相比如何可读。 现在,关于YAML的最酷的部分是:它了解Python对象! 无需自定义编码器和解码器。 这是使用YAML的复杂序列化/反序列化:
> serialized = yaml.dump(complex)
> print serialized
a: !!python/object:__main__.A
simple:
boolean: true
int_list: [1, 2, 3]
none: null
number: 3.44
text: string
when: 2016-03-07 00:00:00
> deserialized = yaml.load(serialized)
> deserialized == complex
True
如您所见,YAML具有