python jit_python中Numba jit警告的解释

最新推荐文章于 2023-01-03 00:40:18 发布

weixin_39716510

最新推荐文章于 2023-01-03 00:40:18 发布

阅读量652

点赞数

文章标签： python jit

1。优化函数（代数简化）

现代CPU的加法和乘法运算非常快。如有可能，应避免使用指数运算。在

示例

在这个例子中，我用一个简单的乘法代替了昂贵的求幂运算。这样的简化可以导致相当高的加速，但也可能改变结果。在

首先，您的实现（float64）没有任何签名，稍后我将在另一个简单的示例中对此进行处理。在#nb.jit(nopython=True) is a shortcut for @nb.njit()

@nb.njit()

def calc_func_opt_1(a, b, n):

res = np.empty(n, dtype=np.float64)

fact=b

res[0] = 0.

res[1] = a * res[0] + (1. - a) *1.

res[2] = a * res[1] + (1. - a) * fact

for i in range(3, n):

fact*=b

res[i] = a * res[i - 1] + (1. - a) * fact

return res

另外一个好主意是尽可能使用标量。在

^{pr2}$

计时%timeit a = calc_func(0.988, 0.9988, 5000)

222 µs ± 2.2 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)

%timeit a = calc_func_opt_1(0.988, 0.9988, 5000)

22.7 µs ± 45.5 ns per loop (mean ± std. dev. of 7 runs, 10000 loops each)

%timeit a = calc_func_opt_2(0.988, 0.9988, 5000)

15.3 µs ± 35.6 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)

2。建议签名吗？在

在提前模式（AOT）中，签名是必需的，但在通常的JIT模式下则不需要。上面的例子不是SIMD-vectoriable。所以你不会看到一个可能不是最优的输入输出声明的正面或负面影响。

让我们看另一个例子。在#Numba is able to SIMD-vectorize this loop if

#a,b,res are contigous arrays

@nb.njit(fastmath=True)

def some_function_1(a,b):

res=np.empty_like(a)

for i in range(a.shape[0]):

res[i]=a[i]**2+b[i]**2

return res

@nb.njit("float64[:](float64[:],float64[:])",fastmath=True)

def some_function_2(a,b):

res=np.empty_like(a)

for i in range(a.shape[0]):

res[i]=a[i]**2+b[i]**2

return res

a=np.random.rand(10_000)

b=np.random.rand(10_000)

#Example for non contiguous input

#a=np.random.rand(10_000)[0::2]

#b=np.random.rand(10_000)[0::2]

%timeit res=some_function_1(a,b)

5.59 µs ± 36.1 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)

%timeit res=some_function_2(a,b)

9.36 µs ± 47.1 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)

为什么带有签名的版本较慢？

让我们仔细看看签名。在some_function_1.nopython_signatures

#[(array(float64, 1d, C), array(float64, 1d, C)) -> array(float64, 1d, C)]

some_function_2.nopython_signatures

#[(array(float64, 1d, A), array(float64, 1d, A)) -> array(float64, 1d, A)]

#this is equivivalent to

#"float64[::1](float64[::1],float64[::1])"

如果在编译时内存布局是未知的，通常不可能对算法进行SIMD矢量化。当然，您可以显式地声明C-contigous数组，但是对于非连续的输入，该函数将不再工作，这通常不是有意的。在

weixin_39716510

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python jit_python中Numba jit警告的解释

1。优化函数（代数简化）现代CPU的加法和乘法运算非常快。如有可能，应避免使用指数运算。在示例在这个例子中，我用一个简单的乘法代替了昂贵的求幂运算。这样的简化可以导致相当高的加速，但也可能改变结果。在首先，您的实现（float64）没有任何签名，稍后我将在另一个简单的示例中对此进行处理。在#nb.jit(nopython=True) is a shortcut for @nb.njit()@nb....
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。