我首先要说的是,你的“只装箱”方式似乎很不寻常,我想这正是@ljetibo在评论中所指的。在“优化”讨论之后,我将回到这个话题。在
首先,您可以通过去掉对np.copy的多余调用来稍微改进代码,因为您只需将重新绑定到传入的img的视图。ravel操作将返回一个副本,除非图像形状是binning因子bin_fac的倍数。在
现在,虽然列表理解速度很快,但是您正在从一个可能不连续的列表中重新创建一个numpy数组,这意味着您要再次将内存从一个位置复制到另一个位置。这些都是消耗效率的操作。在
您可能感兴趣的是在原始图像上生成一个内存高效的视图。这就是as_strided的作用:from numpy.lib.stride_tricks import as_strided
def strided_rescale(g, bin_fac):
strided = as_strided(g,
shape=(g.shape[0]//bin_fac, g.shape[1]//bin_fac, bin_fac, bin_fac),
strides=((g.strides[0]*bin_fac, g.strides[1]*bin_fac)+g.strides))
return strided.mean(axis=-1).mean(axis=-1) # order is NOT important! See notes..
时序考虑表明,这通常比原始方法快一点,随着装箱因子的增加,性能得到改善:
^{2}$
我相信在数组相等性方面观察到的细微差异是由于复制操作,即从numpy数据类型返回到普通Python浮点,反之亦然。但我不能百分之百肯定。在