python函数 系列目录:python函数——目录
0.前言
最近在看一些深度学习的开源代码,发现很多作者使用pickle
模块,查了一些资料,与之相关的解释说是序列化与反序列化,通俗一点来说就相对于游戏中的存档和读档
1. Pickle
Pickle
模块将任意一个Python对象转换成一系统字节。
Pickle
模块有2个常用的函数方法,一个叫做dump()
,另一个叫做load()
dump()
就是序列化操作,也就是存档
load()
就是反序列化操作,也就是读档
下面一一介绍
2. dump()-序列化-存档
2.1 dump语法
Code.2.1 dump()语法
>>>import pickle
>>>pickle.dump(对象, 文件,[使用协议])
对象:就是你要存的东西,类型可以是list、string以及其他任何类型
文件:就是要将对象存储的目标文件
使用协议:有3种,索引0为ASCII,1是旧式2进制,2是新式2进制协议,不同之处在于后者更高效一些,默认的话dump方法使用0做协议。
2.2 示例
Code.2.2 dump()示例 部分代码
tokenizer = Tokenizer()
tokenizer.fit_on_texts(train[0] + train[1] + dev[0] + dev[1] + test[0] + test[1])
with open('./new_tokenizer_v5.pickle', 'wb') as handle:
pickle.dump(tokenizer, handle)
上面代码主要看最后一行,就是将tokenizer
对象存储至new_tokenizer_v5.pickle
文件中
3. load()-反序列化-读档
3.1 load 语法
Code.3.1 load()语法
pickle.load(文件)
3.2 load 示例
Code.3.2 load()示例 部分代码
tokenizer = pickle.load(open('./new_tokenizer_v5.pickle', 'rb'))