任意复杂的对象《==》对象的文本或二进制表示(双向转换)
- 序列化
pickle.dump(),二进制的形式(’wb’)序列化到文件fw
imageDict = get_imageDict() # 获取图片字典imageDict
with open('../yy/Data/weibo/image_demo.pickle', 'wb') as fw:
# 序列化图片字典到文件fw
pickle.dump(imageDict, fw)
w_file = open("../Data/weibo/word_embedding.pickle", "wb")
pickle.dump([W, W2, word_idx_map, vocab, max_l], w_file)
w_file.close()
pickle.dumps(),不需要写入文件,直接返回一个序列化的bytes对象
pickle.dumps(obj, protocol=None,*,fix_imports=True)
- 返序列化
pickle.load()
with open('../yy/Data/weibo/image_demo.pickle', 'rb') as fr:
#反序列化方法加载输出
image = pickle.load(fr)
不同版本python加载文件(转化编码方式)的问题: ‘ascii’ codec can’t decode byte 0xe4 in position 0: ordinal not in range(128)
python2
原理:会将 unicode 作为“中间编码”,但 unicode 最大只有128那么长。所以当尝试将 ascii 编码字符串转换成"中间编码" unicode 时,由于超出了其范围,就报出了如上错误。
解决办法:将Python的默认编码方式修改为utf-8,在py文件开头加入以下代码:
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
python3
sys.setdefaultencoding(‘utf-8’)已被禁用,将导入文件代码加上encoding='bytes’则可解决:
x = pickle.load(open("./data/coco/word2vec.p","rb"), encoding='bytes')