np.memmap

当处理大型数据集时,pandas的速度可能较慢且可能导致内存不足。numpy的memmap功能提供了解决方案,它允许分块读写磁盘上的大文件,避免一次性加载所有数据。通过创建memmap对象,可以映射文件到内存并进行操作,写入数据后直接保存,无需显式删除。读取时再次映射文件,即可高效访问数据。这种方法尤其适用于内存受限的环境。
摘要由CSDN通过智能技术生成

np.memmap

pandas的处理速度要比numpy慢,而遇到特别大的数组、矩阵时,numpy将数据读入内存也会发生IO内存不足,即便读入了内存操作也很慢,这时候用memmap。
memmap可以将大文件分小段读写。使用时,会先为磁盘上的数据创建一个映射,对映射赋值,然后保存即可将数据写入磁盘。读取时也是通过映射,将修改通过映射写入磁盘。
#创建memmap
fp = np.memmap(filename, dtype=‘float32’, mode=‘w+’, shape=(3,4))
#赋值写入memmap
fp[:] = data[:]
#删除(或关闭)memmap
del fp
#读取memmap
fpr = np.memmap(filename, dtype=‘float32’, mode=‘r’, shape=(3,4))

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值