每日学习--python pickle模块

任意复杂的对象《==》对象的文本或二进制表示(双向转换)

  1. 序列化
    pickle.dump(),二进制的形式(’wb’)序列化到文件fw
  imageDict = get_imageDict()  # 获取图片字典imageDict
  with open('../yy/Data/weibo/image_demo.pickle', 'wb') as fw:
        # 序列化图片字典到文件fw
        pickle.dump(imageDict, fw)
	w_file = open("../Data/weibo/word_embedding.pickle", "wb")
    pickle.dump([W, W2, word_idx_map, vocab, max_l], w_file)
    w_file.close()

pickle.dumps(),不需要写入文件,直接返回一个序列化的bytes对象

pickle.dumps(obj, protocol=None,*,fix_imports=True)
  1. 返序列化
    pickle.load()
      with open('../yy/Data/weibo/image_demo.pickle', 'rb') as fr:
        #反序列化方法加载输出
        image = pickle.load(fr)

不同版本python加载文件(转化编码方式)的问题: ‘ascii’ codec can’t decode byte 0xe4 in position 0: ordinal not in range(128)

python2

原理:会将 unicode 作为“中间编码”,但 unicode 最大只有128那么长。所以当尝试将 ascii 编码字符串转换成"中间编码" unicode 时,由于超出了其范围,就报出了如上错误。
解决办法:将Python的默认编码方式修改为utf-8,在py文件开头加入以下代码:

import sys
reload(sys) 
sys.setdefaultencoding('utf-8')

python3
sys.setdefaultencoding(‘utf-8’)已被禁用,将导入文件代码加上encoding='bytes’则可解决:

x = pickle.load(open("./data/coco/word2vec.p","rb"), encoding='bytes')

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值