python 数组赋值后内存区域是不是同一片_将numpy数组拆分为不相等的块

最新推荐文章于 2023-10-05 20:54:24 发布

元宿six

最新推荐文章于 2023-10-05 20:54:24 发布

阅读量123

点赞数

文章标签： python 数组赋值后内存区域是不是同一片

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_31236101/article/details/113966131

版权

在我的程序中，我用元素填充一个大的numpy数组，这些元素的数量我事先不知道。由于每次向numpy数组添加单个元素是低效的，所以我增加了它的大小，长度为10000的块用零初始化。这就导致了这样一种情况，最终我得到了一个尾数为0的数组。我想要的是数组，它的长度正好是有意义元素的数量(因为后来我无法区分零值和零值的实际数据点)。然而，直接复制切片会使RAM消耗翻倍，这是不可取的，因为我的数组相当大。我研究了numpy.split函数，但它们似乎只将数组分成大小相等的块，这当然不适合我。在

我用下面的代码来说明这个问题：import numpy, os, random

def check_memory(mode_peak = True, mark = ''):

"""Function for measuring the memory consumption (Linux only)"""

pid = os.getpid()

with open('/proc/{}/status'.format(pid), 'r') as ifile:

for line in ifile:

if line.startswith('VmPeak' if mode_peak else 'VmSize'):

memory = line[: -1].split(':')[1].strip().split()[0]

memory = int(memory) / (1024 * 1024)

break

mode_str = 'Peak' if mode_peak else 'Current'

print('{}{} RAM consumption: {:.3f} GB'.format(mark, mode_str, memory))

def generate_element():

"""Test element generator"""

for i in range(12345678):

yield numpy.array(random.randrange(0, 1000), dtype = 'i4')

check_memory(mode_peak = False, mark = '#1 ')

a = numpy.zeros(10000, dtype = 'i4')

i = 0

for element in generate_element():

if i == len(a):

a = numpy.concatenate((a, numpy.zeros(10000, dtype = 'i4')))

a[i] = element

i += 1

check_memory(mode_peak = False, mark = '#2 ')

a = a[: i]

check_memory(mode_peak = False, mark = '#3 ')

check_memory(mode_peak = True, mark = '#4 ')

该输出：

^{pr2}$

有谁能帮我找到一个解决方案，不显着惩罚运行时间或RAM消耗？在

编辑：

我试着用a = numpy.delete(a, numpy.s_[i: ])

以及a = numpy.split(a, (i, ))[0]

然而，它同样会导致内存消耗翻倍

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。