python pickle dump_[python技巧]使用pickle.dump出现memoryError

最新推荐文章于 2022-10-13 15:09:03 发布

Doctor 秦

最新推荐文章于 2022-10-13 15:09:03 发布

阅读量853

点赞数

文章标签： python pickle dump

本文链接：https://blog.csdn.net/weixin_34118050/article/details/114912059

版权

问题描述：

在使用pickle来持久化将大量的numpy arrays存入硬盘时候，使用pickle.dump方法的时出现MemoryError。

解决办法：

本质原来是因为pickle本身的一些bug，对大量数据无法进行处理，但是在pickle4.0+可以对4G以上的数据进行操作，stack overflow上有人给出了一些解释和分批次写入disk的方法。

但是我觉得这都是不是一些好办法，最好的办法就是抛弃pickle，使用joblib这个包来实现持久化存储。其主页详细介绍了如何来使用joblib。

简单介绍一下joblib中dump和load的使用，比如如果我们要将一个numpy arrays存入文件：

import numpy as np

data = [('a', [1, 2, 3]), ('b', np.arange(10))]

with open(filename, 'wb') as fo:

joblib.dump(data, fo)

with open(filename, 'rb') as fo:

joblib.load(fo)

joblib还有并行处理和压缩存储等功能，这些都可以在主页找到相应的example。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Doctor 秦

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

2.python/pytorch编程debug

驽马十驾，功在不舍；锲而不舍，金石可镂。

05-10

1万+

快速解决python中的bug，这里总有你需要的。

Python3学习笔记_INDEX（汇总）

qq_34764582的博客

03-18

5536

目录建议不要光看，要多动手敲代码。眼过千遭，不如手读一遍。python注释python运算符比较：type()和 isinstance()基本数据类型Number(数字)数学函数随机数函数字符串格式化输出字符串内建函数列表 list增删改查其他内置函数元组字典增删改查其他内置函数集合 set增删其他条件控制循环函数不定长参数匿名函数变量作用域迭代器生成器 generator闭包闭包定义使用闭包的注...

参与评论您还未登录，请先登录后发表或查看评论

[python技巧]使用pickle.dump出现memoryError

热门推荐

yinhui_zhang的博客

10-26

1万+

问题描述：在使用pickle来持久化将大量的numpy arrays存入硬盘时候，使用pickle.dump方法的时出现MemoryError。解决办法：本质原来是因为pickle本身的一些bug，对大量数据无法进行处理，但是在pickle4.0+可以对4G以上的数据进行操作，stack overflow上有人给出了一些解释和分批次写入disk的方法。但是...

python error pickle.dump 报错MemoryError

qq_20481015的博客

09-27

1942

问题描述：使用pickle保存大量的numpy arrays，使用pickle.dump方法的时经常出现MemoryError。错误信息如图所示。解决办法：根本原因是因为pickle本身的一些问题，对大量numpy arrays无法进行处理。解决这个问题最好的办法就是抛弃pickle，使用joblib这个包来实现存储。详细信息：https://pypi.o...

问题记录--解决pickle.dump存在的memory error问题

牵一只蜗牛去散步

10-13

1490

当使用pickle.dump()保存超过4G的数据时，会报memory error的问题。

pickle.dump()把大量数据写入文件发生MemoryError解决方法

chao_1083934282的博客

03-11

9759

跑了12个小时的代码，最后因为pickle.dump()发生MemoryError错误，实在头疼。pickle.dump()有个bug就是不能存储大量数据，所以只能用别的方法，我用的是joblib读写方式，轻松搞定，Yes! from sklearn.externals import joblib #写的方式 save_file = os.path.join(save_path, "detec...

pickle错误“MemoryError”

xulingqiang的专栏

09-05

2265

问题描述：32位 Python 使用pickle 加载较大的数据时，发生了“MemoryError” 错误。解决办法：换成64位的就可以了

python构造方法报错_解决python多线程报错:AttributeError: Can't pickle local object问题

weixin_39591455的博客

12-10

1824

报错信息：Traceback (most recent call last):File “D:/flaskProject/test.py”, line 35, in testpool.apply(self.out, args=(i,))File “Python37-32\lib\multiprocessing\pool.py", line 261, in applyreturn self.appl...

pickle —— Python 对象序列化(python=3.8)

Allen_by的博客

10-20

1825

模块 pickle 实现了对一个 Python 对象结构的二进制序列化和反序列化。 “Pickling” 是将 Python 对象及其所拥有的层次结构转化为一个字节流的过程，而 “unpickling” 是相反的操作，会将（来自一个 binary file 或者 bytes-like object 的）字节流转化回一个对象层次结构。Pickling（和 unpickling）也被称为“序列化”, ...

python将列表写入文件_使用Python将列表写入文件

weixin_39613824的博客

11-23

1681

使用Python将列表写入文件这是将列表写入文件最干净的方法，因为writelines()不插入换行符吗？file.writelines(["%s\n" % item for item in list])似乎有一种标准方式......17个解决方案600 votes你可以使用循环：with open('your_file.txt', 'w') as f:for item in my_list:f...

python实现在pickling的时候压缩的方法

01-20

本文实例讲述了python实现在pickling的时候压缩的方法。分享给大家供大家参考。具体方法如下： import cPickle,gzip def save(filename,*objects): fil1 = gzip.open(filename,'wb') for obj in objects: cPickle.dump(obj,fil1,protocol = 2) fil1.close() def load(filename): fil1 = gzip.open(filename,'rb') while True: try: y

[Python 技巧] 使用Pickle出现Memory Error

LeYOUNGER的博客

04-16

7811

如题，头疼找到解决方法如下： https://stackoverflow.com/questions/28068872/memoryerror-with-pickle-in-python 使用sklearn - joblib代替： https://blog.csdn.net/suibianshen2012/article/details/52808726...

pytorch 保存模型出错, pickler.dump(obj) Error

周迪新的博客

10-05

424

那个把报错中的 serialization.py 文件开头的 PROTOCOL=2 改成 PROTOCOL=4 我的报错中 serialization.py 的路径是 lib/python3.8/site-packages/torch/serialization.py

python pickle文件大小_在python中pickling数据时的MemoryError

weixin_29263201的博客

03-01

567

我试图使用python中提供的’dump’命令将字典转换为pickle格式.字典的文件大小约为150 MB,但只有115 MB的文件被转储时才会出现异常.例外是：Traceback (most recent call last):File "C:\Python27\generate_traffic_pattern.py", line 32, in b.dump_data(way_id_data,'...

python文件操作：pickle模块多次dump后出现的读取问题

Olivia0615的博客

05-25

4557

在学习pickle的过程中遇到了多次dump后的读取问题，在网上找到如下解决办法： import pickle a=1 b=2 c=3with open("ceshi.txt","wb") as f: pickle.dump(a,f) pickle.dump(b,f) pickle.dump(c,f) f=open("ceshi.txt","rb") with...

python中memoryerror_Python中使用Pickle的MemoryError

weixin_29568097的博客

02-03

738

我正在处理一些数据,我已将结果存储在三个词典中,并且我已将它们保存到使用Pickle的磁盘中.每个字典有500-1000MB.现在我正在加载它们：import picklewith open('dict1.txt', "rb") as myFile:dict1 = pickle.load(myFile)但是,我已经在加载第一个字典了：*** set a breakpoint in malloc_e...

如何处理pickle.dump 出现MemoryError

疯狂的鸡窝

09-12

4437

问题: 我使用pickle写入大量数据到imdb中,出现MemoryError 问题原因: pickle无法写入超过4.0GB以上的数据,overstackflow上写了一些解决办法:如分批存储python-3-can-pickle-handle-byte-objects-larger-than-4gb 这些使用都比较麻烦,我在网上查到了joblib,这个支持存大文件pypi-joblib 如:使...

python pickle 模块的使用以及2种典型报错处理

攻城狮的家园

05-10

3939

用于序列化的两个模块　　json：用于字符串和Python数据类型间进行转换　　pickle: 用于python特有的类型和python的数据类型间进行转换　　json提供四个功能：dumps,dump,loads,load 　　pickle提供四个功能：dumps,dump,loads,load pickle可以存储什么类型的数据呢？所有python支持的原生类型：布尔值，整数，浮点数...

python pickle protocol_Python序列化pickle模块使用详解

最新发布

05-13