欢迎各位小哥哥小姐姐阅读本的文章,对大家学习有帮助,请点赞加关注哦!!!!!!!!!!
您的点赞和关注将是我持续更新的动力呢.^v^
有不懂的问题可以私聊我哦!
分析
当numpy的numpy.apply_along_axis()函数优于简单的Python循环时,有点困惑。例如,考虑具有许多行的矩阵的情况,并且您希望计算每行的总和:
x = np.ones([100000, 3])sums1 = np.array([np.sum(x[i,:]) for i in range(x.shape[0])])sums2 = np.apply_along_axis(np.sum, 1, x)
在这里,我甚至使用内置的numpy函数,np.sum但计算sums1(Python循环)需要不到400毫秒而calculate sums2(apply_along_axis)需要超过2000毫秒(Windows上的NumPy 1.6.1)。通过进一步的比较方式,R的rowMeans函数通常可以在不到20ms的时间内完成(我很确定它正在调用C代码),而类似的R函数apply()可以在大约600ms内完成。
解决方案
np.sum取一个axis参数,这样你就可以简单地计算总和
sums3 = np.sum(x, axis=1)
这比你提出的两种方法快得多。
(至于为什么apply_along_axis更慢 - 我不知道,可能是因为该函数是用纯Python编写的,并且更通用,因此比数组版本更少的优化机会。)
最后多说一句,小编是一名python开发工程师,这里有我自己整理了一套最新的python系统学习教程,包括从基础的python脚本到web开发、爬虫、数据分析、数据可视化、机器学习等。想要这些资料的可以关注小编,并在后台私信小编:“01”即可领取。