日萌社
人工智能AI:Keras PyTorch MXNet TensorFlow PaddlePaddle 深度学习实战(不定时更新)
1 numba介绍
numba是一个用于编译Python数组和数值计算函数的编译器,这个编译器能够大幅提高直接使用Python编写的函数的运算速度。
numba使用LLVM编译器架构将纯Python代码生成优化过的机器码,通过一些添加简单的注解,将面向数组和使用大量数学的python代码优化到与c,c++和Fortran类似的性能,而无需改变Python的解释器。numba的编译方式如下图所示:
为什么选择numba?
虽然有 cython 和 Pypy 之类的许多其他编译器,选择Numbade 原因很简单,不必离开 python 代码的舒适区,不需要为了获得一些的加速来改变您的代码,我们只需要添加一个装饰器到Python函数中即可完成加速,而且加速效果与cython代码相当。
2.numba的使用方法
numba对代码进行加速时,给要优化的函数加上@jit优化器即可。使用jit的时候可以让numba来决定什么时候以及怎么做优化。如下简单的例子所示:
from numba import jit
@jit
def f(x, y):
return x + y
print(f(1,2))
这段代码的计算在被调用是第一次执行,numba将在调用期间推断参数类型,然后基于这个信息生成优化后的代码。numba也能够基于输入的类型编译生成特定的代码。例如,对于上面的代码,传入整数和浮点数作为参数将会生成不同的代码:
Numba编译的函数可以调用其他编译函数。 例如:
from numba import jit
import math
import numpy
@jit
def hypot(x, y):
return math.sqrt(numpy.square(x) + numpy.square(y))
print(hypot(1,2))
我们现在看一个例子:
from numba import jit
import time
@jit
def foo():
x = []
for a in range(100000000):
x.append(a)
def foo_withoutfit():
y = []
for b in range(100000000):
y.append(b)
现在我们定义相同的方法,实现的功能也是一样的,一个是利用numba进行加速,一个没有加速,我们看下他们的运行时间:
总结
- numba是进行python加速的工具包
- 在要进行加速的python函数中添加装饰器@jit即可实现代码的加速
from numba import jit
import math
import numpy
@jit
def f(x, y):
return x + y
print(f(1,2)) #3
@jit
def hypot(x, y):
return math.sqrt(numpy.square(x) + numpy.square(y))
print(hypot(1,2)) #2.23606797749979
from numba import jit
import time
@jit
def foo():
x = []
for a in range(100000000):
x.append(a)
def foo_withoutfit():
y = []
for b in range(100000000):
y.append(b)
"""
这不是python的语复法,是ipython的特殊功能,用于测试语句运行的时间。
ipython安装:pip install ipython.
打开ipython:命令行输制入ipython就可以了。
"""
# In [2]: %time foo()
# Wall time: 2.64 s
# In [3]: %time foo_withoutfit()
# Wall time: 7.49 s
In [4]:
from numba import jit
import time
In [6]:
@jit
def foo():
x=[]
for a in range(100000000):
x.append(a)
In [7]:
def foo_withoutfit():
y=[]
for b in range(100000000):
y.append(b)
In [8]:
%time foo()
CPU times: user 2.05 s, sys: 324 ms, total: 2.37 s
Wall time: 2.11 s
In [9]:
%time foo_withoutfit()
CPU times: user 8.41 s, sys: 2.25 s, total: 10.7 s
Wall time: 10.7 s