定义
从狭义上讲,对象序列化是指把一些内存中的对象转变成字节流,以便保存到文件或者通过网络传输。等以后再通过反序列化转变成内存中的对象。
从广义上讲,把对象转换成JSON,CSV等数据格式也被称为序列化。
序列化并不是Python特有的技术,几乎所有编程语言都有序列化技术。因为编程语言无非是一个解决问题的工具,不管用什么编程语言都要解决序列化的问题,也就是下面的场景。
场景
序列化的场景无非这几个:
1.把对象转换成JSON或XML格式,方便网络传输,通常是使用Rest API传输。
2.把对象转成字节流,方便远程方法调用。
远程方法调用,简单说就是你电脑上的程序调用另外一台机器的方法,这和调用自己的程序中的方法有本质区别,对象需要转成字节流通过网络传输。其实这种方法用的越来越少,因为大部分人会使用第一种方法中的API。
3.把对象转换成字节流保存到硬盘,以便下次回来可以继续。
假设你正在玩一个游戏,里面正热火朝天的玩着呢,各种角色(对象)创建了很多。忽然家长回来了,你需要马上关闭电脑。你肯定希望有一种能力可以保存现场,等家长出去了你可以回来继续接着玩,而不是回来从零开始玩。这就是对象序列化的绝佳场景。虽然你的游戏不一定使用对象序列化的技术。
再举一个例子,假设你在运算一个复杂的人工智能模型,这个模型很复杂,你用了三天三夜才计算到某一个中间结果,里面有100万个对象。这时候你也希望能够把对象保存起来,下次可以直接加载到内存快速继续,而不是从新开始三天三夜的运算或者从新构建100万个对象。
案例
假设我们用Python写了一个网络程序,计算出了2022年最受欢迎的4大美食,这个结果在内存中是一个列表list,里面放着4个food对象。
class Food:
def __init__(self, name, origin, calories, price):
self.name = name
self.origin = origin #产地
self.calories = calories #卡路里
self.price &