前言
numpy 数组直接与一个标量运算就能实现按元素运算,很简洁,但是如果这个标量也是用函数求的,怎么写更高效呢?比如做归一化,数组 / 数组和,是直接/np.sum(数组)还是先得到数组和再运算呢?
实验
方式a就是/np.sum(数组),方式b是先得到数组和再运算,由于数组大小有限制,这里为了拉大差距进行了多次迭代:
import numpy as np
import time
def timer(start, name):
duration = time.time() - start
time_list = [0, 0, 0]
time_list[0] = duration // 3600
time_list[1] = (duration % 3600) // 60
time_list[2] = round(duration % 60, 2)
print(name + '用时:' + str(time_list[0]) + ' 时 ' + str(time_list[1]) + '分' + str(time_list[2]) + '秒')
def a(nums):
nums = nums / np.sum(nums)
def b(nums):
sum_ = np.sum(nums)
nums = nums / sum_
x = np.random.randn(500000000)
iter = 100
s = time.time()
for _ in range(iter):
a(x)
timer(s, 'a')
s = time.time()
for _ in range(iter):
b(x)
timer(s, 'b')
输出:
a用时:0.0 时 3.0分34.98秒
b用时:0.0 时 3.0分11.88秒
可以看出先求和再运算是要快一点。
由于我没搜到numpy的实现机制,所以通过实验来观察,有朋友懂其中机制的话请不吝赐教。